用于增加骨矿化的组合物和方法

文档序号:1092350阅读:927来源:国知局
专利名称:用于增加骨矿化的组合物和方法
技术领域
本发明总体上涉及制药学产品和方法;具体而言,本发明涉及适于增加骨矿物质含量的方法和组合物。这些组合物和方法可用于治疗多种状况,包括例如骨质减少、骨质疏松、骨折以及以骨矿物质密度低作为疾病标志的其它疾病。
背景技术
在人的一生中存在两个或三个明显的骨质变化阶段(参阅Riggs,West J.Med.15463-77,1991)。第一个阶段男性和女性都有,发展达到骨质峰值。这第一个阶段是通过软骨内生长板的线性生长以及由于一定比率骨膜并置引起的径向生长而实现的。第二个阶段对于骨小梁(扁骨,诸如椎骨和骨盆)而言在大约30岁开始,而对于皮层骨(例如四肢中的长骨)而言在大约40岁开始,并持续至老年。这个阶段的特点是骨缓慢流失,而且在男性和女性中都存在。在女性中还存在骨流失的第三个阶段,最有可能是因为绝经后雌激素缺乏所致。仅是在这个阶段,女性可能额外由皮层骨流失10%骨质,而由小梁区室内流失25%(参阅Riggs,见上文)。
在多种状况中会引起骨矿物质含量流失,而且可能导致重大的医学问题。例如,骨质疏松是使人衰弱的疾病,其特征是骨骼的骨质和矿物质密度显著下降,骨结构退化(包括骨显微结构退化),以及患病个体中骨易碎性和骨折易感性相应增加。在美国,在大约2500万人中发现了临床骨质减少(骨矿物质密度比年轻成年人骨平均值低1-2.5个标准偏差),这种状况是骨质疏松在人体中的前期表现。在美国还另有700-800万患者诊断患有临床骨质疏松(定义为骨矿物质含量比成熟年轻成年人骨低2.5个标准偏差以上)。骨质疏松对于保健系统而言是最费钱的疾病之一,在美国每年花费数百亿美元。除了保健相关费用以外,长期居家护理和失业时间加重了这种疾病的财政和社会负担。全世界大约有7500万人有患上骨质疏松的危险。
人群中骨质疏松的频率随年龄而增加,而且在白人中主要女性中存在(在美国占骨质疏松患者的80%)。老年人中骨骼易碎性和骨折易感性的增加会由于这个群体意外摔倒的风险较大而加重。在美国每年报道超过150万例骨质疏松相关骨折。髋骨、腕骨、和椎骨骨折是与骨质疏松有关的最常见损伤。特别是髋骨骨折对于患者而言极其不舒服且费用高昂,而且对于女性而言与高比率的死亡率和发病率有关。
尽管已经注意到骨质疏松会由于骨质减少而增加骨折风险,然而目前可用于骨骼疾病的治疗都不能实质性增加成年人的骨密度。所有医生强烈感觉到需要能够增加成年人骨密度的药物,特别是在骨质减少和骨质疏松中有风险的腕骨、脊柱和髋骨中增加骨密度的药物。
目前用于预防骨质疏松的策略可以为个体提供一些益处,但是不能确保解决该疾病。这些策略包括对老龄患者而言缓和身体活动(特别是承重活动),在饮食中添加适量钙,且避免消费含有酒精或烟草的产品。对于出现了临床骨质减少或骨质疏松的患者而言,所有现行治疗药物和策略均致力于通过抑制骨吸收过程来减少骨质进一步流失,但骨吸收过程是组成性地存在的骨重建过程的天然成分。
例如,现在用雌激素处方阻止骨流失。然而,对患者是否有任何长期益处以及对75岁以上患者究竟是否有任何效果存在一些争论。此外,一般认为使用雌激素会增加乳癌和子宫内膜癌的风险。
对绝经后妇女还建议饮食添加大剂量钙,无论是否添加维生素D。然而,大剂量的钙常常具有不舒服的胃肠副作用,而且必须连续监测血清和尿液钙水平(参阅Khosla和Rigss,Mayo Clin.Proc.70978-982,1995)。
曾经提议的其它治疗剂包括降钙素、二膦酸酯类、同化类固醇和氟化钠。然而,这些治疗剂所具有的不良副作用(例如,降钙素和类固醇可能引起恶心并激发免疫反应,二膦酸酯类和氟化钠可能抑制骨折修复,尽管骨密度有适度增加)可能阻止其使用(参阅Khosla和Rigss,见上文)。
目前实行的治疗策略尚未涉及刺激或增强新骨质生长的药物。本发明提供了可用于增加骨矿化、由此可用于治疗期望增加骨质的多种状况的组合物和方法。另外,本发明还具有其它相关优势。
发明概述如上所述,本发明提供了TGF-β结合蛋白的新类别或家族,以及用于选择增加骨矿物质含量和骨矿物质密度的化合物的测定法、增加骨矿物质含量和骨矿物质密度的化合物、以及在治疗或预防多种疾病时利用这些化合物的方法。
本发明的一个方面提供了分离的核酸分子,其中所述核酸分子选自下组(a)包含SEQ ID NO1、5、7、9、11、13、或15或者其互补序列的分离核酸分子;(b)在高严谨条件下与(a)的核酸分子特异杂交的分离核酸分子;和(c)依照(a)或(b)且编码TGF-β结合蛋白的分离核酸分子。本发明的相关方面提供了分离的核酸分子,所述核酸分子仅仅与上文定义序列之一的一部分杂交(例如,对于(a)而言,可以是与选自SEQ ID NO1第156位-第539位或第555位-第687位核苷酸的至少20、25、50、或100个核苷酸的探针发生杂交)。应当显而易见的是,杂交所采取的必需严谨性可以根据探针长度而变化。例如,对于长度为25个核苷酸的探针而言,高严谨条件可以包括60mMTris pH8.0、2mM EDTA、5×Denhardt氏溶液、6×SSC、0.1%(w/v)N-月桂基肌氨酸、0.5%(w/v)NP-40(nonidet P-40)于45℃保温过夜,随后用0.2×SSC/0.1%SDS于45-50℃清洗两次。对于低严谨条件下长度为100个核苷酸的探针而言,合适的条件可以包括5×SSPE、5×Denhardt氏溶液和0.5%SDS于42-50℃保温过夜,随后用2×SSPE(或2×SSC)/0.1%SDS于42-50℃清洗两次。
本发明的相关方面提供了与SEQ ID NO1、5、7、9、11、13、或15具有同源性的分离核酸分子,使用Wilbur-Lipman算法测定同源性水平为50%、60%、75%、80%、90%、95%、或98%的核酸分子。这些分离分子的代表性实例包括例如编码包含序列SEQ ID NO2、6、10、12、14或16或是与这些序列具有同源性的蛋白质的核酸分子,使用Wilbur-Lipman算法测定其同源性水平为50%、60%、75%、80%、90%、95%、或98%。
分离的核酸分子的长度通常小于100kb,而且,在某些实施方案中,长度小于50kb、25kb、10kb、或甚至5kb。另外,在其它实施方案中,分离的核酸分子不是存在于其它无关核酸分子的“文库”中(例如BAC亚克隆,诸如GenBank编号AC003098和EMB编号AQ171546中所述)。然而,分离的核酸分子可以在相关分子的文库中找到(例如,对于改组而言,诸如美国专利号5,837,458、5,830,721、和5,811,238中所述)。最后,本文所述分离的核酸分子不包括编码Dan、Cerberus、Gremlin、或SCGF(美国专利号5,780,263)的核酸分子。
本发明还提供了包含上文所述核酸分子的克隆载体以及包含与上文所述核酸分子之一可操作连接的启动子(例如调控序列)的表达载体。合适启动子的代表性实例包括组织特异性启动子和基于病毒的启动子(例如基于CMV的启动子诸如CMV I-E、SV40早期启动子、和MuLVLTR)。表达载体也可以基于或衍生自病毒(例如“病毒载体”)。病毒载体的代表性实例包括单纯疱疹病毒载体、腺病毒载体、腺病毒伴随病毒载体、和逆转录病毒载体。还提供了包含或含有任何上述载体的宿主细胞(包括例如人、猴、狗、大鼠、或小鼠起源的宿主细胞)。
本发明的其它方面提供了生成TGF-β结合蛋白的方法,包括如下步骤在一定条件下将上述包含载体的宿主细胞培养足够时间以生成TGF-β结合蛋白。在其它实施方案中,可以进一步纯化通过这种方法生成的蛋白质(例如通过柱层析、亲和纯化、等等)。由此,基于本申请的公开内容,可以容易的生成由上文所述核酸分子编码的分离蛋白质(例如SEQ ID NO2、4、6、8、10、12、14、或16)。
还应当注意,可以以融合蛋白的形式生成上述蛋白质或其片段。例如,本发明的一个方面提供了含有第一多肽区段和第二多肽区段的融合蛋白,该第一多肽区段包含由上文所述核酸分子编码的TGF-β结合蛋白或其长度为至少10、20、30、50、或100个氨基酸的部分,该第二多肽区段包含非TGF-β结合蛋白。在某些实施方案中,第二多肽可以是适于纯化或识别的标签(例如包含多个阴离子氨基酸残基的多肽-参阅美国专利号4,851,341)、标记物(例如绿色荧光蛋白或碱性磷酸酶)或毒性分子(例如蓖麻毒素)。
本发明的另一个方面提供了能够与上文所述TGF-β结合蛋白类别(例如人BEER)特异结合的抗体。在各种实施方案中,所述抗体可以是多克隆抗体或单克隆抗体(例如人或鼠起源的)。在其它实施方案中,该抗体是保留了完整抗体的结合特性的抗体片段(例如F(ab′)2、F(ab)2、Fab′、Fab、或Fv片段,或甚至是CDR)。还提供了能够生成或表达上述抗体的杂交瘤和其它细胞。
本发明的相关方面提供了检测TGF-β结合蛋白的方法,包括如下步骤在一定条件下将上文所述抗体保温足够时间以容许所述抗体与TGF-β结合蛋白结合,并检测结合。在多种实施方案中,抗体可以结合于固相支持物上以便于清洗或分离,和/或是标记的(例如使用选自下组的标记物酶、荧光蛋白、和放射性同位素)。
本发明的其它方面提供了在高严谨条件下与依照SEQ ID NO1、3、5、7、9、11、13、15、17、或18或者其互补序列的核酸分子杂交的分离寡核苷酸。在另一些实施方案中,寡核苷酸可以存在于编码SEQID NO2、4、6、8、10、12、14、或16的序列中。在某些实施方案中,寡核苷酸的长度是至少15、20、30、50、或100个核苷酸。在另一些实施方案中,寡核苷酸是用另一种分子(例如酶、荧光分子、或放射性同位素)标记的。还提供了能够特异扩增编码TGF-β结合蛋白的上文所述核酸分子的全部或部分的引物。在用于本文时,术语“特异扩增”应当理解为指扩增上述TGF-β结合蛋白而非其它TGF-β结合蛋白诸如Dan、Cerberus、Gremlin、或SCGF(美国专利号5,780,263)的引物。
本发明的相关方面提供了用于检测编码TGF-β结合蛋白的核酸分子的方法,包括如下步骤在高严谨条件下将上文所述寡核苷酸保温,并检测所述寡核苷酸的杂交。在某些实施方案中,寡核苷酸可以是标记的和/或结合于固相支持物上。
本发明的其它方面提供了能够切割编码上文所述TGF-β结合蛋白(例如SEQ ID NO2、6、8、10、12、14、或16)之一的RNA的核酶。这些核酶可以由DNA、RNA(包括2′-O-甲基核糖核酸)、核酸类似物(例如具有硫代磷酸酯键的核酸)或其混合物组成。还提供了编码这些核酶的核酸分子(例如DNA或cDNA),以及能够表达或生成核酶的载体。载体的代表性实例包括质粒、逆转座子、粘粒、和基于病毒的载体(例如至少部分由逆转录病毒、腺病毒、或腺伴随病毒产生的病毒载体)。还提供了包含这些载体的宿主细胞(例如人、狗、大鼠、或小鼠细胞)。在某些实施方案中,宿主细胞可以是经载体稳定转化的。
本发明的另一些方面提供了通过人工合成或是体外或体内转录来生成核酶的方法。在另一些实施方案中,由此生成的核酶可以进一步纯化和/或配制成药物组合物(例如核酶或编码核酶的核酸分子以及制药学可接受载体或稀释剂)。类似的,可以将本文所述反义寡核苷酸和抗体或是选择的其它分子配制成药物组合物。
本发明的其它方面提供了包含与依照SEQ ID NO1、3、5、7、9、11、13、或15或者其互补序列的核酸分子发生杂交的核酸分子的反义寡核苷酸,其中所述寡核苷酸抑制上文所述TGF-β结合蛋白(例如人BEER)的表达。在一些实施方案中,寡核苷酸的长度是15、20、25、30、35、40、或50个核苷酸。优选的是,寡核苷酸的长度小于100、75、或60个核苷酸。应当显而易见的是,寡核苷酸可以由一种或多种核酸类似物、核糖核酸、或脱氧核糖核酸组成。另外,寡核苷酸可以通过一种或多种键修饰,包括例如共价键,诸如硫代磷酸酯键、磷酸三酯键、膦酸甲酯键、亚甲基(甲基亚氨基)键、吗啉基键、酰胺键、聚酰胺键、短链烷基糖间键、环烷基糖间键、短链杂原子糖间键、和杂环糖间键。美国专利号5,989,912提供了嵌合寡核苷酸的一个代表性实例。
本发明的另一个方面提供了用于增加骨矿化的方法,包括将有效量的上文所述核酶导入温血动物。在相关方面,这些方法包括如下步骤在有助于核酸分子转录生成核酶的条件下,将有效量的上文所述能够生成期望核酶的核酸分子或载体导入患者。
本发明的其它方面提供了转基因非人动物。在一个实施方案中,提供了其生殖细胞和体细胞中含有编码上文所述TGF-β结合蛋白的核酸分子的转基因动物,所述核酸分子可操作连接了对被导入到该动物或处于胚胎阶段的该动物祖先的基因表达有效的启动子,条件是所述动物不包括人。在其它实施方案中,提供了转基因敲除动物,包括其生殖细胞和体细胞在与编码上文所述TGF-β结合蛋白的核酸分子发生杂交的内源核酸分子的至少一个等位基因中包含破坏的动物,其中与不含该破坏的动物相比,所述破坏阻止由所述等位基因转录信使RNA,条件是所述动物不包括人。在各种实施方案中,所述破坏指核酸缺失、替代、或插入。在其它实施方案中,转基因动物指小鼠、大鼠、绵羊、猪、或狗。
本发明的另一些方面提供了用于检测TGF-β结合蛋白基因表达的试剂盒,包含装有核酸分子的容器,其中所述核酸分子选自下组(a)包含SEQ ID NO1、3、5、7、9、11、13、15、100、或101的核苷酸序列的核酸分子;(b)包含(a)中核苷酸序列的互补序列的核酸分子;(c)作为(a)或(b)的片段、长度为至少15、20、30、50、75、或100个核苷酸的核酸分子。还提供了用于检测TGF-β结合蛋白的试剂盒,其中包含装有本文所述TGF-β结合蛋白抗体之一的容器。
例如,本发明的一个方面提供了用于测定选择的分子是否能够增加骨矿物质含量的方法,包括下列步骤(a)将一种或多种候选分子与由依照权利要求1的核酸分子编码的TGF-β结合蛋白和选定的TGF-β家族蛋白成员(例如BMP-5或6)混合;(b)测定候选分子是否改变TGF-β家族成员的信号传导,或是否改变TGF-β结合蛋白与TGF-β家族成员的结合。在某些实施方案中,所述分子可改变TGF-β作为间充质细胞分化正调节物发挥功能的能力。在本发明的这个方面,候选分子可能通过例如减少(例如抑制)或增加(例如增强)信号传导或结合而改变信号传导或结合。
本发明的还有一个方面提供了用于测定选择的分子是否能够增加骨矿物质含量的方法,包括如下步骤测定选择的分子是否抑制TGF-β结合蛋白与骨或其类似物的结合。骨或其类似物的代表性实例包括羟磷灰石和通过活组织检查得到的原代人骨样品。
在上文所述方法的某些实施方案中,选择的分子包含在分子混合物中,而且该方法还包括分离一种或多种在测定中有功能的分子的步骤。在还有一个实施方案中,将TGF-β家族的蛋白结合于固相支持物上并测量TGF-β结合蛋白的结合,或者将TGF-β结合蛋白结合于固相支持物上并测量TGF-β蛋白的结合。
利用诸如上文所述方法,可以对多种分子测定它们通过抑制TGF-β结合蛋白与TGF-β家族蛋白相结合来增加骨矿物质含量的能力。这些分子的代表性实例包括蛋白质或肽、有机分子、和核酸分子。
本发明的其它相关方面提供了用于在温血动物中增加骨矿物质含量的方法,包括如下步骤对温血动物施用治疗有效量的通过本文所述测定法鉴定的分子。本发明的另一个方面提供了用于在温血动物中增加骨矿物质含量的方法,包括如下步骤对温血动物施用治疗有效量的抑制TGF-β结合蛋白与包括骨形态发生蛋白(BMP)在内的TGF-β超家族蛋白相结合的分子。合适分子的代表性实例包括反义分子、核酶、核酶基因、和特异识别TGF-β结合蛋白并改变其活性的抗体(例如人源化抗体)。
本发明的另一个方面提供了用于在温血动物中增加骨矿物质含量的方法,包括下列步骤(a)将指导如下分子表达的载体导入归巢至骨的细胞,所述分子可抑制TGF-β结合蛋白与TGF-β家族蛋白和骨形态发生蛋白(BMP)相结合;并(b)对温血动物施用含有该载体的细胞。在用于本文时,应当理解,若细胞在外周施用后定位于骨基质内,则它们“归巢至骨”。在一个实施方案中,这些方法还包括在导入步骤前由骨髓分离归巢至骨的细胞。在另一个实施方案中,归巢至骨的细胞选自CD34+细胞和成骨细胞。
本发明的其它方面提供了抑制TGF-β结合蛋白与TGF-β超家族蛋白相结合的(优选分离的)分子。
在另一些实施方案中,可以以组合物的形式提供分子,而且还可以包括骨再吸收的抑制剂。这些抑制剂的代表性实例包括降钙素、雌激素、二膦酸酯、具有抗再吸收活性的生长因子、和它莫西芬。
可以在上文所述治疗性方案中使用的分子的代表性实例包括例如核酶、核酶基因、反义分子、和/或抗体(例如人源化抗体)。根据这些分子的选择,它们可用于改变、拮抗、或刺激本文所述TGF-β结合蛋白家族成员的信号传导或结合。
在本发明的多种实施方案中,上文所述分子以及治疗或预防方法可用于诸如骨质疏松、骨软化、牙周病、坏血病、库欣病、骨折等状况以及由于四肢固定和使用类固醇引起的状况。
本发明还提供了与TGF-β结合蛋白硬化素(SOST)特异结合的抗体,并提供了含有由硬化素(sclerostin)中与TGF-β超家族成员诸如骨形态发生蛋白相互作用的区域衍生的硬化素肽的免疫原。在一个实施方案中,本发明提供了与硬化素多肽特异结合的抗体或其抗原结合片段,所述硬化素多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,其中所述抗体竞争性抑制SOST多肽与(i)骨形态发生蛋白(BMP)I型受体结合位点和(ii)BMP II型受体结合位点中至少其一的结合,其中BMP I型受体结合位点能够与包含GenBank编号NM_004329(SEQ ID NO102)、D89675(SEQ ID NO103)、NM_001203(SEQ ID NO104)、S75359(SEQ ID NO105)、NM_030849(SEQ IDNO106)、D38082(SEQ ID NO107)、NP_001194(SEQ ID NO108)、BAA19765(SEQ ID NO109)、或AAB33865(SEQ ID NO110)所示氨基酸序列的BMP I型受体多肽结合,而且其中BMP II型受体结合位点能够与包含GenBank编号U25110(SEQ ID NO111)、NM_033346(SEQ ID NO112)、Z48923(SEQ ID NO114)、CAA88759(SEQ ID NO115)、或NM_001204(SEQID NO113)所示氨基酸序列的BMP II型受体多肽结合。在另一个实施方案中,本发明提供了与硬化素多肽特异性结合并削弱硬化素均二聚体形成的抗体或其抗原结合片段,其中所述硬化素多肽包含SEQ IDNO2、6、8、14、46、或65所示氨基酸序列。
在本发明的某些特殊实施方案中,所述抗体是多克隆抗体。在其它实施方案中,所述抗体是单克隆抗体,例如小鼠、人、大鼠、或仓鼠单克隆抗体。本发明还提供了能够生成该单克隆抗体的杂交瘤细胞或宿主细胞。在本发明的其它实施方案中,所述抗体是人源化抗体或嵌合抗体。本发明还提供了生成该人源化或嵌合抗体的宿主细胞。在某些实施方案中,所述抗体的抗原结合片段是F(ab′)2、Fab′、Fab、Fd或Fv片段。本发明还提供了作为单链抗体的抗体,并提供了能够表达该单链抗体的宿主细胞。在另一个实施方案中,本发明提供了包含这些抗体和制药学可接受载体的组合物。
在另一个实施方案中,本发明提供了包含SOST多肽中至少21个连续氨基酸且不超过50个连续氨基酸的肽的免疫原,所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,其中所述肽能够在非人动物中引发与该SOST多肽特异性结合并竞争性抑制SOST多肽与(i)骨形态发生蛋白(BMP)I型受体结合位点和(ii)BMP II型受体结合位点中至少其一的结合的抗体,其中BMP I型受体结合位点能够与包含GenBank编号NM_004329(SEQ ID NO102)、D89675(SEQID NO103)、NM_001203(SEQ ID NO104)、S75359(SEQ ID NO105)、NM_030849(SEQ ID NO106)、D38082(SEQ ID NO107)、NP_001194(SEQ ID NO108)、BAA19765(SEQ ID NO109)或AAB33865(SEQ ID NO110)所示氨基酸序列的BMP I型受体多肽结合,而且其中BMP II型受体结合位点能够与包含GenBank编号U25110(SEQ IDNO111)、NM_033346(SEQ ID NO112)、Z48923(SEQ ID NO114)、CAA88759(SEQ ID NO115)或NM_001204(SEQ ID NO113)所示氨基酸序列的BMP II型受体多肽结合。本发明还提供了包含SOST多肽中至少21个连续氨基酸且不超过50个连续氨基酸的肽的免疫原,所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,其中所述肽能够在非人动物中引发与该SOST多肽特异结合并削弱硬化素均二聚体形成的抗体。
在某些特殊实施方案中,本发明的免疫原与载体分子相关联。在某些实施方案中,载体分子是载体多肽,而且在特定实施方案中,载体多肽是匙孔_血蓝蛋白。
本发明还提供了用于生成与SOST多肽特异结合的抗体的方法,包括用包含SOST多肽中至少21个连续氨基酸且不超过50个连续氨基酸的肽的免疫原免疫非人动物,其中(a)所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列;(b)所述抗体竞争性抑制SOST多肽与(i)骨形态发生蛋白(BMP)I型受体结合位点和(ii)BMP II型受体结合位点中至少其一结合;(c)BMP I型受体结合位点能够与包含GenBank编号NM_004329(SEQ ID NO102)、D89675(SEQ ID NO103)、NM_001203(SEQ ID NO104)、S75359(SEQ ID NO105)、NM_030849(SEQ ID NO106)、D38082(SEQ ID NO107)、NP_001194(SEQ ID NO108)、BAA19765(SEQ ID NO109)或AAB33865(SEQ IDNO110)所示氨基酸序列的BMP I型受体多肽结合;且(d)BMP II型受体结合位点能够与包含GenBank编号U25110(SEQ ID NO111)、NM_033346(SEQ ID NO112)、Z48923(SEQ ID NO114)、CAA88759(SEQ ID NO115)或NM_001204(SEQ ID NO113)所示氨基酸序列的BMP II型受体多肽结合。
在另一个实施方案中,本发明提供了用于生成与SOST多肽特异结合的抗体的方法,所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,该方法包括用包含SOST多肽中至少21个连续氨基酸且不超过50个连续氨基酸的肽的免疫原免疫非人动物,所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,其中所述抗体削弱SOST均二聚体的形成。
在参考下文详述和附图后,本发明的这些和其它方面将变得清楚。另外,将包括本文所列的更加详细描述某些流程或组合物(例如质粒等)的各种参考文献在内的文件完整收录作为参考。
附图简述

图1是比较人Dan、人Gremlin、人Cerberus、和人Beer氨基酸序列的示意图。箭头指示半胱氨酸主链。
图2概括了对多种人组织测量TGF-β结合蛋白基因、尤其是人Beer基因表达的结果。使用半定量逆转录-聚合酶链式反应(RT-PCR)流程由自总RNA合成的第一链cDNA扩增该基因的一部分(实施例2A中有更详细的描述)。
图3A-3D概括了由小鼠胚胎切片的RNA原位杂交获得的结果,其中使用与小鼠Beer转录本互补的cRNA探针(实施例2B中有更详细的描述)。小图3A是10.5dpc胚胎的横切片。小图3B是12.5dpc胚胎的纵切片。小图3C和3D是15.5dpc胚胎的纵切片。
图4A-4C通过western印迹分析例示了三种不同的多克隆抗体对它们各自抗原的特异性(实施例4中有更详细的描述)。图4A显示了抗人Beer抗体对人Beer抗原有特异反应性,对人Dan或人Gremlin却没有。图4B显示了抗人Gremlin抗体对人Gremlin抗原有反应性,对人Beer或人Dan却没有。图4C显示了抗人Dan抗体对人Dan有反应性,对人Beer或人Gremlin却没有。
图5通过western印迹分析例示了TGF-β结合蛋白Beer对BMP-5和BMP-6而非BMP-4的选择性(实施例5中有更详细的描述)。
图6证明了TGF-β结合蛋白Beer与BMP-5之间的离子相互作用的解离常数在15-30nM范围内。
图7展示了SOST(硬化素)多肽及其最密切同源物中包含特征性胱氨酸结的区域的比对。形成胱氨酸结的三对二硫键以实线显示。以虚线显示的一对额外二硫键对这个家族而言是独特的,它在3D结构中连接两个β发夹尖端。所述多肽是SOST硬化素(SEQ ID NO126);CGHB人绒毛膜促性腺激素β(SEQ ID NO127);FSHB促卵泡激素β亚基(SEQ ID NO128);TSHB促甲状腺素β链前体(SEQ ID NO129);VWFVon Willebrand因子(SEQ ID NO130);MUC2人粘液素2前体(SEQ ID NO131);CER1Cerberus 1(Xenopus laevis同系物)(SEQ ID NO132);DRMgremlin(SEQ ID NO133);DAN(SEQ ID NO134);CTGF结缔组织生长因子前体(SEQ ID NO135);NOVNovH(肾胚细胞瘤过度表达基因蛋白同系物)(SEQ ID NO136);CYR6(SEQ ID NO137)。
图8例示了SOST核心区的3D模型(SOST_Core)。
图9展示了SOST均二聚体的核心区的3D模型。
图10A和10B提供了来自五种不同动物的头蛋白氨基酸序列比对人(NOGG_HUMAN,SEQ ID NO138);鸡(NOGG_CHICK,SEQ ID NO139);非洲爪蟾(NOGG_XENLA,SEQ ID NO140);NOGG_FUGRU,SEQID NO141;和斑马鱼(NOGG_ZEBRA,SEQ ID NO142);以及来自人(SOST_HUMAN,SEQ ID NO46)、大鼠(SOST_RAT,SEQ ID NO65)、和小鼠(SOST_Mouse,SEQ ID NO143)的SOST。
图11例示了头蛋白/BMP-7复合物结构。BMP均二聚体以表面模式显示在图的底部。头蛋白均二聚体以卡通模式显示在BMP二聚体的顶部。圆圈描绘了N端结合区、核心区、和N端与核心区之间的接头。
图12描绘了位于SOST N端区的潜在BMP结合片段的3D模型。BMP二聚体以表面模式显示,而潜在的BMP结合片段以棍模式显示。指出了拟合到BMP表面上疏水口袋内的苯丙氨酸残基。
发明详述定义在详细阐述本发明前,先行阐明下文将用到的某些术语的定义、列出并定义缩写可能有助于理解本发明。
“分子”应当理解为包括蛋白质或肽(例如具有期望结合特性的抗体、重组结合伙伴、肽);核酸(例如DNA、RNA、嵌合核酸分子、和诸如PNA等核酸类似物);以及有机或无机化合物。
“TGF-β”应当理解为包括任何已知的或新的TGF-β超家族成员,它也包括骨形态发生蛋白(BMP)。
“TGF-β受体”应当理解为指对TGF-β超家族的特定成员(包括骨形态发生蛋白(BMP))特异的受体。
“TGF-β结合蛋白”应当理解为指具有针对TGF-β超家族特定成员或成员亚群(包括骨形态发生蛋白(BMP))的特异结合亲和力的蛋白质。TGF-β结合蛋白的具体实例包括由SEQ ID NO1、5、7、9、11、13、15、100、和101编码的蛋白质。
抑制“TGF-β结合蛋白与TGF-β家族蛋白和骨形态发生蛋白(BMP)结合”应当理解为指通过清除或阻止TGF-β与TGF-β结合蛋白结合,容许TGF-β或骨形态发生蛋白(BMP)的激活,或是容许包括骨形态发生蛋白(BMP)在内的TGF-β家族成员与它们各自受体结合的分子。这种抑制可以通过例如抑制TGF-β结合蛋白与TGF-β超家族的特定成员相结合的分子来实现。
“载体”指能够指导期望蛋白质表达的装配体。载体必需包含与目的基因可操作连接的转录启动子元件。载体可以由脱氧核糖核酸(“DNA”)、核糖核酸(“RNA”)、或二者组合(例如DNA-RNA嵌合物)组成。可选的是,载体可以包含多聚腺苷酸化序列、一个或多个限制位点、以及一个或多个选择标记,诸如新霉素磷酸转移酶或潮霉素磷酸转移酶。另外,根据选择的宿主细胞和采用的载体,本文所述载体中还可以掺入了其它遗传元件,诸如复制起点、额外的核酸限制位点、增强子、赋予转录以可诱导性的序列、和选择标记。
“分离的核酸分子”指未整合到生物体的基因组DNA中的核酸分子。例如,已经与真核细胞的基因组DNA分离开的编码TGF-β结合蛋白的DNA分子就是分离的DNA分子。分离的核酸分子的另一个实例是未整合到生物体的基因组中的化学合成核酸分子。分离的核酸分子可以是基因组DNA、cDNA、RNA,或是至少部分由核酸类似物组成。
“分离的多肽”指本质上不合在自然界中与该多肽相关联的污染性细胞成分诸如碳水化合物、脂质、或其它蛋白质性杂质的多肽。优选的是,这些分离的多肽是至少大约90%纯、更优选至少大约95%纯、最优选至少大约99%纯。在某些实施方案中,若特定蛋白质制剂标称在用考马斯蓝染色的SDS-PAGE凝胶上显现单一条带,则它包含分离的多肽。术语“分离的”在提及有机分子(例如有机小分子)时意味着根据本领域众所周知的方法(例如NMR、熔点)的测定,该化合物超过90%纯。
“硬化性骨化病”是Hansen(1967)(Hansen,H.G.,sklerosteose。Opitz,H.;Schmid,F.,《Handbuch der Kinderheilkunde》,柏林,Springer出版社,61967,第351-355页)用于命名在许多病例中与van Buchem弥漫性骨皮质增生相似、但可能在骨变化的放射学表现和存在食指与中指的不对称皮肤并指方面有所不同的疾病的术语。在这种状况中,颌骨具有异常方正的外观。
“人源化抗体”指其中单克隆抗体的鼠或其它非人动物互补决定区已经由鼠或非人动物免疫球蛋白的重链和轻链可变区转移至人可变区中的重组蛋白。
在用于本文时,“抗体片段”指抗体的一部分,诸如F(ab′)2、F(ab)2、Fab′、Fab等等。无论结构如何,抗体片段都与完整抗体所识别的相同抗原结合。例如,抗TGF-β结合蛋白单克隆抗体片段与TGF-β结合蛋白的表位结合。
术语“抗体片段或抗原结合片段”还包括通过与特定抗原结合、形成复合物而像抗体那样发挥作用的任何合成或基因工程化蛋白质。例如,抗体片段包括由轻链可变区组成的分离片段、由重链和轻链可变区组成的“Fv”片段、其中轻链和重链可变区以肽接头相连的重组单链多肽分子(“scFv蛋白”)、和由模拟高变区的氨基酸残基组成的最小识别单位。
“可检测标记物”指能够与多肽部分诸如抗体部分或核酸部分缀合而产生可用于诊断的分子的分子或原子。可检测标记物的实例包括螯合剂、光敏剂、放射性同位素、荧光剂、顺磁离子、酶、和其它标记物部分。
在用于本文时,“免疫缀合物”指包含抗TGF-β结合蛋白抗体或抗体片段以及可检测标记物或效应分子的分子。优选的是,免疫缀合物在缀合后具有与缀合前大致相同或只是略微降低的与TGF-β结合蛋白相结合的能力。
缩写TGF-β-“转化生长因子-β”;TGF-βBP-“转化生长因子-β结合蛋白”(一种代表性TGF-bBP命名为“H.Beer”);BMP-“骨形态发生蛋白”;PCR-“聚合酶链式反应”;RT-PCR-其中首先使用逆转录酶(RT)将RNA转录成DNA的PCR程序;cDNA-通过将RNA序列复制成DNA形式而产生的任何DNA。
如上所述,本发明提供了TGF-β结合蛋白的新类别,以及用于在温血动物中增加骨矿物质含量的方法和组合物。简而言之,本发明基于如下意外发现编码TGF-β结合蛋白家族新成员的基因中的突变会导致特征为骨矿物质含量比正常个体高1-4倍的罕见状况(硬化性骨化病)。由此,正如下文将更为详细的讨论,这项发现导致了可用于选择抑制TGF-β结合蛋白与TGF-β蛋白家族和骨形态发生蛋白(BMP)结合的分子的测定法以及利用这些分子来增加温血动物(包括例如人)骨矿物质含量的方法的开发。
称为硬化性骨化病(sclerosteosis)的疾病的讨论硬化性骨化病是人体中与异常骨矿物质密度有关的疾病。硬化性骨化病是Hansen(1967)(Hansen,H.G.,Sklerosteose。Opitz,H.;Schmid,F.,《Handbuch der Kinderheilkunde》,柏林,Springer出版社,61967,第351-355页)用于命名在许多病例中与van Buchem弥漫性骨皮质增多症相似、但可能在骨变化的放射学表现和存在食指与中指的不对称皮肤并指方面有所不同的疾病的术语。
现在知道硬化性骨化病是成年人中以广泛散布的骨硬化损伤为特征的常染色体半显性疾病。这种状况是渐进的。硬化性骨化病还具有与并指(两个或多个手指合并在一起)有关的发育状态。硬化性骨化病综合症与身材高大有关,许多患病个体的身高达到6英尺或更高。纯合子的骨矿物质含量可以比正常个体高1至6倍,而骨矿物质密度可以比正常值(例如来自未患病的兄弟姐妹)高1至4倍。
硬化性骨化病综合症主要发生于荷兰血统的南非白人。南非白人人群中每140个人有大约1人是突变型基因的携带者(杂合子)。突变显示100%的外显率。有杂合子中骨矿物质密度增加而无相关病理(并指或头骨过度生长)的有趣报道。
在硬化性骨化病患者中没有观察到垂体-下丘脑轴的异常。具体而言,看来不存在生长激素和皮质素过度生成。另外,患病个体的性激素水平是正常的。然而,骨周转标志物(成骨细胞特异性碱性磷酸酶、骨钙蛋白、1型前胶原C′前肽(PICP)、和总碱性磷酸酶(参阅Comier,C.,Curr.Opin.Rheu.7243,1995))指示存在与疾病有关的过度成骨细胞活性,但是,根据骨再吸收标志物(吡啶啉、脱氧吡啶啉、N-端肽、尿液羟脯氨酸、血浆抗酒石酸酸性磷酸酶、和半乳糖基羟赖氨酸(参阅Comier,见上文))的测量,存在正常至略微降低的破骨细胞活性。
硬化性骨化病的特征是患病个体一生中全身骨骼内骨的持续沉积。在纯合子中,骨矿物质的持续沉积导致缺乏机械刺激受体的骨骼部位(头骨、颌骨、颅骨)过度生长。在患有硬化性骨化病的纯合子中,头骨的骨过度生长导致头颅压缩,最终由于对脑干的过度流体静力压而导致死亡。在骨骼的所有其它部分,存在普遍且弥散的硬化。长骨的皮层区域大大增厚,导致骨强度实质性增加。小梁连接的厚度增加,继而增加骨小梁的强度。硬化骨在x射线下显示异常的不透明。
正如实施例1中更为详细的描述,已经将引起硬化性骨化病综合症的罕见基因突变定位于人17号染色体中编码TGF-β结合蛋白家族(其代表性实例称为“H.Beer”)新成员的区域。正如下文更为详细的描述,根据这个发现,骨矿化的机制得到更加充分的理解,从而能够开发用于选择增加骨矿化的分子的测定法,并且将这些分子用于增加骨矿物质含量,并用于预防多种疾病。
TGF-β超家族转化生长因子-β(TGF-β)超家族包括共享共同序列元件和结构基元(在二级和三级两种水平上)的多种生长因子。已知这个蛋白质家族发挥影响多种细胞类型的广谱生物学反应。许多TGF-β家族成员在胚胎发育过程中在模式形成和组织特化中具有重要功能;在成年人中,TGF-β家族成员涉及例如伤口愈合、骨修复和骨重建、以及免疫系统的调控。除了TGF-β以外,该超家族还包括骨形态发生蛋白(BMP)、激活素、抑制素、生长和分化因子(GDF)、以及神经胶质衍生的神经营养因子(GDNF)。初步分类是通过将特定蛋白质归入一般亚家族的一般序列特征而制定的。由于更小组成员之间更严格的序列保守性,有可能在亚家族内进一步分层。在某些情况中,诸如BMP-5、BMP-6和BMP-7,更小组成员之间的氨基酸同一性可以高到75%。这个同一性水平使得一个代表性序列能够说明亚组中将它与更大家族其它成员区分的关键生物化学元件。
已经测定了TGF-β2的晶体结构。TGF-β2单体的一般折叠包含通过三个二硫桥形成的稳定的致密半胱氨酸结样结构。通过一个二硫桥稳定化的二聚化是反向平行的。
TGF-β通过诱导I和II型受体的异型寡聚复合物的形成而进行信号传导。TGF-β信号的转导涉及跨膜丝氨酸/苏氨酸激酶受体的这两种不同的I型和II型亚家族。已经鉴定了至少7种I型受体和5种II型受体(参阅Kawabata等,Cytokine Growth Factor Rev.949-61,1998;Miyazono等,Adv.Immunol.75115-57,2000)。TGF-β家族成员通过与具有丝氨酸/苏氨酸激酶活性的受体结合来启动它们的细胞作用。每个TGF-β家族成员与I型和II型受体的特征性组合相结合,二者都是信号传导所需要的。在TGF-β受体激活的现行模型中,首先TGF-β配体与II型受体(TbR-II)结合,后者在细胞膜中以寡聚物形式与激活的激酶一起存在。此后,在缺乏TbR-II时不能与配体结合的I型受体(TbR-I)被募集到复合物中而形成配体/II型/I型三元复合物。然后,TbR-II主要在近膜区域中富含甘氨酸和丝氨酸残基的结构域(GS结构域)内磷酸化TbR-I,并由此激活TbR-I。然后,激活后的I型受体激酶磷酸化Smad蛋白家族的特定成员,后者转位至细胞核,在那里它们将调控特定基因的转录。
骨形态发生蛋白(BMP)是决定人体骨矿物质密度的关键调控蛋白对骨形成的认识方面的一项主要进展是骨形态发生蛋白(BMP)(也称为生骨蛋白(OP))的鉴定,它在体内调节软骨和硬骨分化。BMP/OP通过一系列级联事件诱导软骨内骨分化,包括软骨形成、软骨肥大和钙化、血管入侵、成骨细胞分化、以及硬骨形成。如上所述,BMP/OP(BMP 2-14,以及生骨蛋白1和2即OP-1和OP-2)(参阅例如GenBankP12643(BMP-2)、GenBank P12645(BMP 3)、GenBank P55107(BMP-3b,生长/分化因子10(GDF-10))、GenBank P12644(BMP4)、GenBankP22003(BMP5)、GenBank P22004(BMP6)、GenBank P18075(BMP7)、GenBank P34820(BMP8)、GenBank Q9UK05(BMP9)、GenBank O95393(BM10)、GenBank O95390(BMP11,生长/分化因子11前体(GDF-11))、GenBank O95972(BM15))是TGF-β超家族的成员。BMP/OP亚家族成员之间惊人的进化保守性说明它们在动物的正常发育和功能方面至关重要。此外,多种形式BMP/OP的存在提出了关于这种明显冗余的生物学相关性的重要问题。除了胎后软骨发生和硬骨发生以外,BMP/OP在骨骼发生(包括颅面和牙齿组织的发育)中和在胚胎发育和包括肾在内的实质器官的器官发生中发挥多种作用。现在认识到依赖改动共同(和少数)分子机制以推动特化组织和器官出现的本质。BMP/OP超家族是在调用高度保守羧基末端区域内具有氨基酸基序微小变异的分子异构体来编制多种特化功能时天性节约的精致实例。
BMP以大型前体蛋白的形式合成。二聚化后,BMP在细胞内进行蛋白水解切割,产生羧基末端成熟蛋白,然后由细胞分泌出去。BMP像其它TGF-β家族成员一样通过与I型和II型丝氨酸/苏氨酸激酶受体二者协同结合来启动信号转导。可以以BMP作为配体的I型受体包括BMPR-IA(也称为ALK-3)、BMPR-IB(也称为ALK-6)、ALK-1、和ALK-2(也称为ActR-I)。至于II型受体,BMP与BMP II型受体(BMPR-II)、II型激活素(ActR-II)、和IIB型激活素(ActR-IIB)结合。(参阅Balemans等,见上文,及其中引用的参考文献)。GenBank数据库中提供了BMP I型受体多肽的多核苷酸序列及所编码的氨基酸序列,例如GenBank NM_004329(SEQ ID NO102,由SEQ ID NO116编码)、D89675(SEQ ID NO103,由SEQ ID NO117编码)、NM_001203(SEQID NO104,由SEQ ID NO118编码)、S75359(SEQ ID NO105,由SEQ ID NO119编码)、NM_030849(SEQ ID NO106,由SEQ ID NO120编码)、和D38082(SEQ ID NO107,由SEQ ID NO121编码)。GenBank数据库中还提供了I型受体的其它多肽序列,例如NP_001194(SEQ ID NO108)、BAA19765(SEQ ID NO109)、和AAB33865(SEQID NO110)。GenBank数据库中提供了BMP II型受体多肽的多核苷酸序列及所编码的氨基酸序列,包括例如U25110(SEQ ID NO111,由SEQ ID NO122编码)、NM_033346(SEQ ID NO112,由SEQ ID NO123编码)、NM_001204(SEQ ID NO113,由SEQ ID NO124编码)、和Z48923(SEQ ID NO114,由SEQ ID NO125编码)。GenBank数据库中还提供了II型受体的其它多肽序列,例如CAA88759(SEQ IDNO115)。
与其它胱氨酸结蛋白相似,BMP形成均二聚体结构(Scheufler等,J.Mol.Biol.287103-15,1999)。根据对BMP/TGF-β家族进行的进化痕迹分析,BMP I型受体结合位点和II型受体结合位点定位于BMP结构的表面(Innis等,Protein Eng.13839-47,2000)。I型受体结合位点在BMP上的定位后来通过BMP-2/BMP受体IA复合物的x射线结构得到了确认(Nickel等,J.Joint Surg.Am.83A(增刊1(Pt1))S7-S14,2001)。预测的II型受体结合位点非常符合TGF-β3/TGF-βII型受体复合物的x射线结构(Hart等,Nat.Struct.Biol.9203-208,2002),它与BMP/BMP受体IIA系统高度相似。
BMP拮抗作用BMP和激活素亚家族通过诸如TGF-β结合蛋白进行意义重大的翻译后调控。存在精细的胞外控制系统,由此合成并输出高亲和力的拮抗剂,随后与BMP或激活素选择性络合而破坏它们的生物学活性(W.C.Smith,TIG 15(1)3-6,1999)。已经鉴定了许多这样的天然拮抗剂,而且根据序列差异,由于缺乏一级序列保守性,这些拮抗剂似乎已经独立进化。这些拮抗剂的早期研究凸现了与BMP-2和BMP-4相互作用并中和它的不同偏爱。在脊椎动物中,拮抗剂包括头蛋白、chordin、chordin样、卵泡抑素、FSRP、DAN/Cerberus蛋白家族和硬化素(SOST)(参阅Balemans等,见上文,及其引用的参考文献)。拮抗或抑制作用的机制似乎对不同拮抗剂是不同的(Iemura等,Proc.Natl.Acad.Sci.USA 959337-9342,1998)。
BMP拮抗剂头蛋白上的I型和II型受体结合位点也已定位。头蛋白以高亲和力与BMP结合(Zimmerman等,1996)。关于头蛋白/BMP-7复合物结构的一项研究揭示了这两种蛋白质之间的结合相互作用(Groppe等,Nature 420636-42,2002)。头蛋白-BMP-7结构在BMP信号传导复合物模型上的叠加显示,头蛋白的结合有效地掩蔽了BMP-7上的两对结合表位(即BMP I型和II型受体结合位点)。头蛋白中富含半胱氨酸的支架序列的前面是称为“夹子”的大约20个氨基酸残基的N端区段(第28-48位残基)。I型受体结合位点被头蛋白夹子结构域的N端部分占据,而II型受体结合位点被该夹子结构域的羧基末端部分占据。头蛋白C端附近的核心区中两条β链也与BMP-7在II型受体结合位点处接触。这种结合模式使得头蛋白二聚体能够有效封闭BMP二聚体上的所有受体结合位点(两个I型和两个II型受体结合位点)。
新的TGF-β结合蛋白如上所述,本发明提供了与人DAN、人Gremlin和人Cerberus、以及SCGF(美国专利号5,780,263)相比具有几乎相同的半胱氨酸(二硫化物)支架、但是在核苷酸水平几乎没有同源性的TGF-β结合蛋白新种类(背景资料通常参阅Hsu,D.R.,Economides,A.N.,Wang,X.,Eimon,P.M.,Harland,R.M.,“非洲爪蟾背化因子Gremlin鉴定为拮抗BMP活性的分泌型蛋白新家族”(The Xenopus Dorsalizing FactorGremlin Identifies a Novel Family of Secreted Proteins thatAntagonize BMP Activities),Molecular Cell1673-683,1998)。
编码TGF-β结合蛋白的核酸分子新种类的代表性实例公开于SEQID NO1、5、7、9、11、13、15、100、和101。本文公开的多核苷酸编码称为Beer的多肽,在本文中也称为硬化素或SOST。这类结合蛋白的代表性成员也应当理解为包括TGF-β结合蛋白的变体(例如SEQ ID NO5和7)。在用于本文时,“TGF-β结合蛋白变体基因”(例如编码TGF-β结合蛋白变体的分离的核酸分子)指编码具有属SEQ ID NO2、10、12、14、16、46、或65修饰形式的氨基酸序列的多肽的核酸分子。这些变体包括TGF-β结合蛋白基因的天然存在的多态性或等位基因变体,以及包含这些氨基酸序列的保守氨基酸替代的合成基因。本领域技术人员知道有多种标准可指示肽或多肽中特定位置的氨基酸是否相似。例如,相似氨基酸或保守氨基酸替代即氨基酸残基被具有相似侧链的氨基酸残基取代,包括具有碱性侧链(例如赖氨酸、精氨酸、组氨酸)、酸性侧链(例如天冬氨酸、谷氨酸)、不带电荷的极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸、组氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β分支侧链(例如苏氨酸、缬氨酸、异亮氨酸)、和芳香族侧链(例如酪氨酸、苯丙氨酸、色氨酸)的氨基酸。被认为更难分类的脯氨酸与具有脂肪族侧链的氨基酸(例如Leu、Val、Ile、和Ala)具有相同性质。在某些情况中,用谷氨酰胺替代谷氨酸或是用天冬酰胺替代天冬氨酸被认为是相似替代,因为谷氨酰胺和天冬酰胺分别是谷氨酸和天冬氨酸的酰胺衍生物。
TGF-β结合蛋白基因的其它变体形式是包含本文所述核苷酸序列的插入或缺失的核酸分子。可以通过测定基因是否与具有核苷酸序列SEQ ID NO1、5、7、9、11、13、15、100、或101的核酸分子在严谨条件下发生杂交来鉴定TGF-β结合蛋白变体基因。另外,TGF-β结合蛋白变体基因应当编码具有半胱氨酸主链的蛋白质。
或者,可以通过序列比较来鉴定TGF-β结合蛋白变体基因。在用于本文时,若两种氨基酸序列的氨基酸残基在进行比对以寻求最大对应性时相同,则这两种氨基酸序列具有“100%氨基酸序列同一性”。类似的,若两种核苷酸序列的核苷酸残基在进行比对以寻求最大对应性时相同,则这两种核苷酸序列具有“100%核苷酸序列同一性”。序列比较可以使用标准软件程序来进行,诸如由DNASTAR(麦迪逊,威斯康星)生产的LASERGENE生物信息学计算套装中包含的程序。本领域技术人员众所周知通过测定最佳比对来比较两种核苷酸或氨基酸序列的其它方法(参阅例如Peruski和Peruski,《因特网和新生物学基因组和分子研究的工具》(The Internet and the New BiologyTools for Genomic and Molecular Research),ASM出版公司,1997年;Wu等编,“核酸和蛋白质的信息超级高速公路和计算机数据库”(Information Superhighway and Computer Databases of NucleicAcids and Proteins),《基因生物技术方法》(Methods in GeneBiotechnology),第123-151页,CRC出版公司,1997年;和Bishop编,《人类基因组计算指南》(Guide to Human Genome Computing),第2版,Academic出版公司,1998年)。
TGF-β结合蛋白变体应当与SEQ ID NO2、6、10、12、14、16、46、或65具有至少50%、优选超过60%、65%、70%、75%、80%、85%、90%、或95%的氨基酸序列同一性。或者,可以通过与SEQ ID NO1、5、9、11、13、15、100、或101具有至少70%的核苷酸序列同一性来鉴定TGF-β结合蛋白变体。此外,本发明涵盖与SEQ ID NO1或SEQID NO100具有超过75%、80%、85%、90%、或95%同一性的TGF-β结合蛋白基因变体。不管用于鉴定TGF-β结合蛋白变体基因或TGF-β结合蛋白变体的具体方法如何,TGF-β结合蛋白变体或由TGF-β结合蛋白变体基因编码的多肽可以在功能上由例如它与TGF-β蛋白家族选定成员结合和/或抑制其信号传导的能力或者它与抗TGF-β结合蛋白抗体特异结合的能力来表征。
本发明包括TGF-β结合蛋白基因的功能片段。在本发明的内容中,TGF-β结合蛋白基因的“功能片段”指编码或是(1)具有上文所述功能活性或是(2)与抗TGF-β结合蛋白抗体特异结合的TGF-β结合蛋白多肽一部分的核酸分子。例如,本文所述TGF-β结合蛋白基因的功能片段包括核苷酸序列SEQ ID NO1、5、9、11、13、15、100、或101的一部分。
2.TGF-β结合蛋白基因的分离编码TGF-β结合蛋白的DNA分子可以通过使用基于例如SEQ IDNO1的多核苷酸探针筛选人类cDNA或基因组文库获得。例如,制备cDNA文库的第一步是使用本领域技术人员众所周知的方法分离RNA。一般而言,RNA分离技术包括破碎细胞的方法,抑制由RNA酶指导的RNA降解的方法,以及由DNA、蛋白质、和多糖污染物分离RNA的方法。例如,可以如下分离总RNA将组织在液氮中冻结,用臼和杵将冻结的组织磨碎以裂解细胞,用酚/氯仿溶液抽提磨碎的组织以除去蛋白质,并通过用氯化锂进行的选择性沉淀由剩余污染物分离RNA(参阅例如Ausubel等编,《分子生物学简略方案》(Short Protocols inMolecular Biology),第3版,第4-1至4-6页,John Wiley & Sons,1995年[“Ausubel,1995”];Wu等,《基因生物技术方法》(Methodsin Gene Biotechnology),第33-41页,CRC出版公司,1997年[“Wu,1997”])。或者,可以如下分离总RNA用异硫氰酸胍抽提磨碎的组织,用有机溶剂抽提,并使用差速离心由污染物分离RNA(参阅例如Ausubel,1995,第4-1至4-6页;Wu,1997,第33-41页)。
为了构建cDNA文库,优选由总RNA制剂分离poly(A)+RNA。可以使用oligo(dT)-纤维素层析的标准技术由总RNA分离Poly(A)+RNA(参阅例如Ausubel,1995,第4-11至4-12页)。可以使用本领域众所周知的技术由poly(A)+RNA合成双链cDNA分子(参阅例如Wu,1997,第41-46页)。此外,可以使用商品化试剂盒来合成双链cDNA分子(例如Life Technologies公司,盖瑟斯堡,马里兰;CLONTECHLaboratories公司,帕洛阿尔托,加利福尼亚;Promega公司,麦迪逊,成斯康星;和Stratagene Cloning Systems,拉霍亚,加利福尼亚)。
可以修改用于获得TGF-β结合蛋白cDNA克隆的基本方法,构建富含TGF结合蛋白特异性cDNA分子的扣除后cDNA文库。用于构建扣除文库的技术对于本领域技术人员而言是众所周知的(参阅例如Sargent,“差异表达基因的分离”(Isolation of DifferentiallyExpressed Genes),Meth.Enzymol.152423,1987;和Wu等编,“扣除和完整cDNA文库的构建和筛选”(Construction and Screeningof Subtracted and Complete Expression cDNA Libraries),《基因生物技术方法》(Methods in Gene Biotechnology),第29-65页,CRC出版公司,1997年)。
多种克隆载体适于构建cDNA文库。例如,可以在衍生自噬菌体的载体中构建cDNA文库,诸如λgt10载体(参阅例如Huynh等,“在λgt10 and λgt11中构建和筛选cDNA文库”(Constructing andScreening cDNA Libraries in λgt10 and λgt11),《DNA克隆实用方法》(DNA CloningA Practical Approach),第1卷,Glover编,第49页,IRL出版社,1985年;Wu,1997,第47-52页)。或者,可以将双链cDNA分子插入质粒载体,诸如pBluescript载体(Stratagene Cloning Systems,拉霍亚,加利福尼亚)、LambdaGEM-4(Promega公司,麦迪逊,威斯康星)、或其它商品化载体。还可以由美国典型培养物收藏中心(罗克维尔,马里兰)获得合适的克隆载体。
为了扩增克隆的cDNA分子,使用标准技术将cDNA文库导入原核宿主。例如,可以将cDNA文库导入可以由Life Technologies公司(盖瑟斯堡,马里兰)获得的感受态大肠杆菌DH5细胞。
可以通过本领域众所周知的方法构建人类基因组DNA文库(参阅例如Ausubel,1995,第5-1至5-6页;Wu,1997,第307-327页)。可以如下分离基因组DNA用去污剂Sarkosyl裂解组织,用蛋白酶K消化裂解物,通过离心由裂解物中清除不溶碎片,使用异丙醇由裂解物沉淀核酸,并在氯化铯密度梯度上纯化重悬的DNA。
可以通过随机剪切基因组DNA或是通过用限制性核酸内切酶部分消化基因组DNA来获得适于构建基因组文库的DNA片段。可以依照常规技术将基因组DNA片段插入诸如噬菌体或粘粒等载体,诸如使用限制酶消化来提供合适末端,使用碱性磷酸酶处理来避免不合乎要求的DNA分子连接,并用合适连接酶进行连接。用于这些操作的技术在本领域是众所周知的(参阅例如Ausubel,1995,第5-1至5-6页;Wu,1997,第307-327页)。
还可以通过聚合酶链式反应(PCR)用具有基于本文所述人TGF-β结合蛋白基因核苷酸序列的核苷酸序列的寡核苷酸引物获得编码TGF-β结合蛋白的核酸分子。例如《分子生物学方法第15卷PCR方案通用方法和应用》(Methods in Molecular Biology,Vol.15PCRProtocolsCurrent Methods and Applications)(White编,第211-215页,Humana出版公司,1993年)中Yu等,“使用聚合酶链式反应来筛选噬菌体文库”(Use of the Polymerase Chain Reactionto Screen Phage Libraries)一文提供了用PCR筛选文库的常规方法。此外,例如《分子生物学方法,第15卷,PCR方案通用方法和应用》(Methods in Molecular Biology,Vol.15PCR ProtocolsCurrent Methods and Applications)(White编,第317-337页,Humana出版公司,1993年)中Preston,“使用简并寡核苷酸引物和聚合酶链式反应来克隆基因家族成员”(Use of DegenerateOligonucleotide Primers and the Polymerase Chain Reaction toClone Gene Family Members)一文描述了使用PCR分离相关基因的技术。
或者,可以由商业来源获得人基因组文库,诸如ResearchGenetics(亨茨维尔,阿拉巴马)和美国典型培养物保藏中心(罗克维尔,马里兰)。可以使用本文所述和本领域知道的标准方法,用一种或多种基于SEQ ID NO1的多核苷酸探针筛选含有cDNA或基因组克隆的文库(参阅例如Ausubel,1995,第6-1至6-11页)。
如本文所述生成的抗TGF-β结合蛋白抗体也可用于由cDNA文库分离编码TGF-β结合蛋白的DNA序列。例如,可以用抗体筛选λgt11表达文库,或者可以在杂合体选择和翻译后用抗体免疫筛选(参阅例如Ausubel,1995,第6-12至6-16页;Margolis等,“用抗体和蛋白质探针筛选λ表达文库”(Screening λ expression libraries withantibody and protein probes),《DNA克隆2表达系统》(DNA Cloning2Expression Systems),第2版,Glover等编,第1-14页,牛津大学出版社,1995年)。
可以使用标准方法测定TGF-β结合蛋白cDNA或TGF-β结合蛋白基因组片段的序列。此外,可以使用已充分确立的技术诸如缺失分析(通常参阅Ausubel,1995,见上文)来完成包含TGF-β结合蛋白启动子或调控元件的基因组片段的鉴定。
或者,可以通过使用共同引发的长寡核苷酸和本文所述核苷酸序列合成DNA分子来获得TGF-β结合蛋白基因(参阅例如Ausubel,1995,第8-8至8-9页)。已确立的使用聚合酶链式反应的技术提供了合成长度为至少2kb的DNA分子的能力(Adang等,Plant Mol.Biol.211131,1993;Bambot等,PCR Methods and Applications 2266,1993;Dillon等,“使用聚合酶链式反应来快速构建合成基因”(Useof the Polymerase Chain Reaction for the Rapid Construction ofSynthetic Genes),《分子生物学方法第15卷PCR方案通用方法和应用》(Methods in Molecular Biology),Vol.15PCR ProtocolsCurrent Methods and Applications,White编,第263-268页,Humana出版公司,1993年;Holowachuk等,PCR Methods Appl.4299,1995)。
3.TGF-β结合蛋白基因的生成可以使用本文所述流程,通过用具有基于SEQ ID NO1、5、9、11、13、15、100、或101的核苷酸序列的多核苷酸探针筛选各种cDNA或基因组文库来获得编码TGF-β结合蛋白基因变体的核酸分子。还可以通过人工合成来构建TGF-β结合蛋白基因变体。例如,可以设计这样的核酸分子,其编码与SEQ ID NO2、6、8、10、12、14、16、46、或65的氨基酸序列相比具有保守氨基酸变化的多肽。换言之,可以获得这样的变体,其包含SEQ ID NO2、6、8、10、12、14、16、46、或65中的一个或多个氨基酸替代,其中用烷基氨基酸替代TGF-β结合蛋白氨基酸序列中的烷基氨基酸、用芳香族氨基酸替代TGF-β结合蛋白氨基酸序列中的芳香族氨基酸、用含硫氨基酸替代TGF-β结合蛋白氨基酸序列中的含硫氨基酸、用含羟基的氨基酸替代TGF-β结合蛋白氨基酸序列中的含羟基氨基酸、用酸性氨基酸替代TGF-β结合蛋白氨基酸序列中的酸性氨基酸、用碱性氨基酸替代TGF-β结合蛋白氨基酸序列中的碱性氨基酸、或用二元单羧基氨基酸替代TGF-β结合蛋白氨基酸序列中的二元单羧基氨基酸。例如,在常见氨基酸中,“保守氨基酸替代”解释为属于下列同一分组的氨基酸之间的替代(1)甘氨酸、丙氨酸、缬氨酸、亮氨酸、和异亮氨酸;(2)苯丙氨酸、酪氨酸、和色氨酸;(3)丝氨酸和苏氨酸;(4)天冬氨酸和谷氨酸;(5)谷氨酰胺和天冬酰胺;以及(6)赖氨酸、精氨酸、和组氨酸。在进行这些替代时,如果有可能的话,重要的是要维持图1中描绘的半胱氨酸主链。
可以通过用核苷酸取代SEQ ID NO1、5、9、11、13、15、100、或101中所述的核苷酸而在TGF-β结合蛋白基因中导入保守氨基酸变化。可以通过例如寡核苷酸介导的诱变、接头扫描诱变、使用聚合酶链式反应的诱变、诸如此类来获得这些“保守氨基酸”变体(参阅Ausubel,1995,第8-10至8-22页;McPherson编,《定向诱变实用方法》(Directed MutagenesisA Practical Approach),IRL出版社,1991年)。可以使用标准方法测定这些变体的功能活性,诸如本文所述测定法。或者,可以通过与抗TGF-β结合蛋白抗体特异结合的能力来鉴定TGF-β结合蛋白多肽变体。
可以进行核酸分子的常规缺失分析,以获得编码TGF-β结合蛋白多肽的核酸分子的“功能片段”。例如,可以用Bal31核酸酶消化具有核苷酸序列SEQ ID NO1的DNA分子以获得一系列嵌套缺失体。然后将片段以正确读码框插入表达载体,分离表达的多肽,并测试其活性或与抗TGF-β结合蛋白抗体结合的能力。核酸外切酶消化的替代方法是使用寡核苷酸介导的诱变,以导入缺失或终止密码子以确定产生期望片段。或者,可以使用聚合酶链式反应合成TGF-β结合蛋白基因的特定片段。
例如Treuter等,Mol.Gen.Genet.240113,1993;Content等,“由人干扰素诱导的42kDa 2-5A合成酶的表达和初步缺失分析”(Expression and preliminary deletion analysis of the 42kDa2-5A synthetase induced by human interferon),《生物学干扰素系统,ISIR-TNO干扰素系统会议录》(Biological InterferonSystems,Proceedings of ISIR-TNO Meeting on InterferonSystems),Cantell编,第65-72页,Nijhoff,1987;Herschman,“EGF受体”(The EGF Receptor),《动物细胞增殖的控制》(Controlof Animal Cell Proliferation),第1卷,Boynton等编,第169-199页,Academic出版社,1985年;Coumailleau等,J.Biol.Chem.27029270,1995;Fukunaga等,J.Biol.Chem.27025291,1995;Yamaguchi等,Biochem.Pharmacol.501295,1995;Meisel等,Plant Mol.Biol.301,1996描述了用于蛋白质功能分析的标准技术。
本发明还涵盖具有保守氨基酸变化的TGF-β结合蛋白基因功能片段。
通过测定与上文所述SEQ ID NO1、5、9、11、13、15、100、或101以及SEQ ID NO2、6、10、12、14、16、46、或65核苷酸和氨基酸序列的同一性水平,可以根据结构来鉴定TGF-β结合蛋白变体基因。根据结构来鉴定基因变体的候选方法是测定编码潜在TGF-β结合蛋白基因变体的核酸分子是否能够与具有SEQ ID NO1、5、9、11、13、15、100、或101的核苷酸序列或者其长度为至少15或20个核苷酸的部分的核酸分子在严谨条件下发生杂交。作为严谨杂交条件的实例,具有TGF-β结合蛋白序列变体的核酸分子能够与具有来自SEQ IDNO1的序列的核酸分子的片段在含有例如5×SSPE(1×SSPE=180mM氯化钠、10mM磷酸钠、1mM EDTA(pH7.7)、5×Denhardt氏溶液(100×Denhardt氏溶液=2%(w/v)牛血清清蛋白、2%(w/v)菲科尔、2%(w/v)聚乙烯吡咯烷酮)和0.5%SDS的缓冲液中于55-60℃保温过夜后相结合。高严谨度的杂交后清洗通常在0.5×SSC(1×SSC=150mM氯化钠、15mM柠檬酸三钠)中或在0.5×SSPE中于55-60℃进行。
不管TGF-β结合蛋白基因变体的具体核苷酸序列如何,该基因编码可通过其功能活性或是它与抗TGF-β结合蛋白抗体特异结合的能力来表征的多肽。更具体的说,TGF-β结合蛋白基因变体编码展示由本文所述人TGF-β结合蛋白基因编码的多肽的至少50%、优选超过60%、70%、80%、或90%活性的多肽。
4.TGF-β结合蛋白在培养细胞中的生成为了表达TGF-β结合蛋白基因,必须将编码该多肽的核酸分子在表达载体中与控制转录表达的调控序列可操作连接,然后导入宿主细胞。除了转录调控序列诸如启动子和增强子以外,表达载体还可以包含翻译调控序列和适于选择携带表达载体的细胞的标记基因。适于在真核细胞中生成外源蛋白的表达载体通常包含(1)编码细菌复制起点和抗生素抗性标记的原核DNA元件,从而提供表达载体在细菌宿主中的生长和选择;(2)控制转录起始的真核DNA元件,诸如启动子;和(3)控制转录本加工的DNA元件,诸如转录终止/多聚腺苷酸化序列。
优选在哺乳动物细胞中表达本发明的TGF-β结合蛋白。哺乳动物宿主细胞的实例包括非洲绿猴肾细胞(Vero;ATCC CRL 1587)、人胚胎肾细胞(293-HEK;ATCC CRL 1573)、幼仓鼠肾细胞(BHK-21;ATCCCRL 8544)、犬肾细胞(MDCK;ATCC CCL 34)、中国仓鼠卵巢细胞(CHO-K1;ATCC CCL61)、大鼠垂体细胞(GH1;ATCC CCL82)、HeLa S3细胞(ATCCCCL2.2)、大鼠肝癌细胞(H-4-II-E;ATCC CRL 1548)、SV40转化的猴肾细胞(COS-1;ATCC CRL 1650)、和鼠胚胎细胞(NIH-3T3;ATCCCRL 1658)。
对于哺乳动物宿主而言,转录和翻译调控信号可以衍生自病毒来源,诸如腺病毒、牛乳头瘤病毒、猿猴病毒、诸如此类,其中调控信号与具有高表达水平的特定基因相关联。合适的转录和翻译调控序列还可以由哺乳动物基因获得,诸如肌动蛋白、胶原蛋白、肌球蛋白和金属硫蛋白基因。
转录调控序列包括足以指导RNA合成起始的启动子区。合适的真核启动子包括小鼠金属硫蛋白I基因的启动子(Hamer等,J.Mol.Appl.Genet.1273,1982)、疱疹病毒的TK启动子(McKnight,Cell31355,1982)、SV40早期启动子(Benoist等,Nature 290304,1981)、劳氏肉瘤病毒启动子(Gorman等,Proc.Natl.Acad.Sci.USA 796777,1982)、巨细胞病毒启动子(Foecking等,Gene 45101,1980)、和小鼠乳癌病毒启动子(通常参阅Etcheverry,“基因工程蛋白质在哺乳动物细胞培养物中的表达”(Expression of Engineered Proteinsin Mammalian Cell Culture),《蛋白质工程原理和实践》(ProteinEngineeringPrinciples and Practice),Cleland等编,第163-181页,John Wiley & Sons公司,1996年)。
或者,如果原核启动子受到真核启动子的调控的话,可以使用原核启动子诸如T3噬菌体RNA聚合酶启动子来控制TGF-β结合蛋白基因在哺乳动物细胞中的表达(Zhou等,Mol.Cell.Biol.104529,1990;Kaufman等,Nucleic Acids Res.194485,1991)。
也可以在细菌、酵母、昆虫、或植物细胞中表达TGF-β结合蛋白基因。可用于在原核宿主中表达TGF-β结合蛋白多肽的合适启动子对于本领域技术人员而言是众所周知的,包括能够识别T4、T3、Sp6、和T7聚合酶的启动子、λ噬菌体的PR和PL启动子、大肠杆菌的trp、recA、热休克、lacUV5、tac、lpp-lacSpr、phoA、和lacZ启动子、枯草芽孢杆菌的启动子、芽孢杆菌噬菌体的启动子、链霉菌的启动子、λ噬菌体的int启动子、pBR322的bla启动子、和氯霉素乙酰基转移酶基因的CAT启动子。原核启动子的综述见Glick,J.Ind.Microbiol.1277,1987,Watson等,《基因的分子生物学》(Molecular Biologyof the Gene),第4版,Benjamin Cummins,1987年;和Ausubel等,1995。
优选的原核宿主包括大肠杆菌和枯草芽孢杆菌。合适的大肠杆菌菌株包括BL21(DE3)、BL21(DE3)pLysS、BL21(DE3)pLysE、DH1、DH4I、DH5、DH5I、DH5IF′、DH5IMCR、DH10B、DH10B/p3、DH11S、C600、HB101、JM101、JM105、JM109、JM110、K38、RR1、Y1088、Y1089、CSH18、ER1451、和ER1647(参阅例如Brown编,《Molecular Biology Labfax》,Academic出版社,1991年)。枯草芽孢杆菌的合适菌株包括BR151、YB886、MI119、MI120、和B170(参阅例如Hardy,“芽孢杆菌克隆方法”(Bacillus Cloning Methods),《DNA克隆实用方法》(DNACloningA Practical Approach),Glover编,IRL出版社,1985年)。
用于在原核宿主中表达蛋白质的方法对于本领域技术人员而言是众所周知的(参阅例如Williams等,“使用质粒载体在大肠杆菌中表达外源蛋白并纯化特异多克隆抗体”(Expression of foreignproteins in E.coli using plasmid vectors and purification ofspecific polyclonal antibodies),《DNA克隆2表达系统》(DNACloning 2Expression Systems),第2版,Glover等编,第15页,牛津大学出版社,1995年;Ward等,“抗体的基因操作和表达”(Genetic Manipulation and Expression of Antibodies),《单克隆抗体原理和应用》(Monoclonal AntibodiesPrinciples andApplications),第137页,Wiley-Liss公司,1995年;和Georgiou,“蛋白质在芽孢杆菌中的表达”(Expression of Proteins inBacteria),《蛋白质工程原理和实践》(Protein EngineeringPrinciples and Practice),Cleland等编,第101页,John Wiley& Sons公司,1996年)。
杆状病毒系统为将克隆的TGF-p结合蛋白基因导入昆虫细胞提供了有效手段。合适的表达载体基于苜蓿银蚊夜蛾多核型多角体病毒(AcMNPV),而且包含众所周知的启动子,诸如果蝇热休克蛋白(hsp)70的启动子、苜蓿银蚊夜蛾核型多角体病毒立即-早期基因启动子(ie-1)和延迟早期39K启动子、杆状病毒p10启动子、和果蝇金属硫蛋白启动子。合适的昆虫宿主细胞包括衍生自IPLB-Sf-21即秋粘虫pupal卵巢细胞系的细胞系,诸如Sf9(ATCC CRL 1711)、Sf21AE、和Sf21(Invitrogen公司,圣迭哥,加利福尼亚)、以及果蝇Schneider-2细胞。已确立的用于在杆状病毒系统中生成重组蛋白的技术参阅Bailey等,“杆状病毒载体的操作”(Manipulation ofBaculovirus Vectors),《分子生物学方法第7卷基因转移和表达方案》(Methods in Molecular Biology),Volume 7Gene Transferand Expression Protocols,Murray编,第147-168页,Humana出版公司,1991年;Patel等,“杆状病毒表达系统”(The baculovirusexpression system),《DNA克隆2表达系统》(DNA Cloning 2Expression Systems),第2版,Glover等编,第205-244页,牛津大学出版社,1995年;Ausubel,1995,第16-37至16-57页;Richardson编,《杆状病毒表达方案》(Baculovirus ExpressionProtocols),Humana出版公司,1995年;和Lucknow,“昆虫细胞表达技术”(Insect Cell Expression Technology),《蛋白质工程原理和实践》(Protein EngineeringPrinciples and Practice),Cleland等编,第183-218页,John Wiley & Sons公司,1996年。
用于在酵母中表达的启动子包括来自GAL1(半乳糖)、PGK(磷酸甘油酸激酶)、ADH(乙醇脱氢酶)、AOX1(乙醇氧化酶)、HIS4(组氨醇脱氢酶)等等的启动子。已经设计了许多酵母克隆载体,而且易于获得。这些载体包括基于YIp的载体诸如YIp5、YRp载体诸如YRp17、YEp载体诸如YEp13、和YCp载体诸如YCp19。本领域技术人员将认识到,有多种载体适于在酵母细胞中进行表达。
也可以将表达载体导入植物原生质体、完整的植物组织、或分离的植物细胞。例如Miki等,“用于将外源DNA导入植物的流程”(Procedures for Introducing Foreign DNA into Plants),《植物分子生物学和生物技术方法》(Methods in Plant MolecularBiology and Biotechnology),Glick等编,第67-88页(CRC出版社,1993年)中提供了培养植物组织的通用方法。
可以使用多种标准技术将表达载体导入宿主细胞,包括磷酸钙转染、脂质体介导的转染、微弹介导的投递、电穿孔诸如此类。优选的是,对转染细胞进行选择和增殖,以提供包含了稳定整合到宿主细胞基因组中的表达载体的重组宿主细胞。例如Ausubel,1995和Murray编,《基因转移和表达方案》(Gene Transfer and ExpressionProtocols),Humana出版社,1991年描述了用于将载体导入真核细胞和使用显性选择标记来选择这些稳定转化体的技术。Ausubel,1995还提供了用于将表达载体导入细菌、酵母、昆虫、和植物细胞的方法。
使用哺乳动物细胞系统表达和回收外源蛋白的通用方法参阅例如Etcheverry,“在哺乳动物细胞培养物中表达基因工程蛋白质”(Expression of Engineered Proteins in Mammalian Cell Culture),《蛋白质工程原理和实践》(Protein EngineeringPrinciplesand Practice),Cleland等编,第163页,Wiley-Liss公司,1996年。用于回收由细菌系统生产的蛋白质的标准技术参阅例如Grisshammer等,“由大肠杆菌细胞纯化过度生产的蛋白质”(Purification of over-produced proteins from E.coli cells),《DNA克隆2表达系统》(DNA Cloning 2Expression Systems),第2版,Glover等编,第59-92页,牛津大学出版社,1995年。已确立的用于由杆状病毒系统分离重组蛋白的方法参阅Richardson编,《杆状病毒表达方案》(Baculovirus Expression Protocols),Humana出版公司,1995年。
更普遍地,可以通过标准技术来分离TGF-β结合蛋白,诸如亲和层析、大小排阻层析、离子交换层析、HPLC诸如此类。本领域技术人员可以设计TGF-β结合蛋白分离和纯化的其它变化。例如,可以使用如下文所述获得的抗TGF-β结合蛋白抗体通过免疫亲和纯化来分离大量蛋白质。
5.针对TGF-β结合蛋白的抗体的生成本发明提供了与本文详细描述的硬化素特异结合的抗体。例如,可以使用表达载体的产物作为抗原以获得针对TGF-β结合蛋白的抗体。也可以使用由本文提供的任一硬化素多肽序列(SEQ ID NO2、6、8、10、12、14、16、46、和65)衍生的肽来制备与硬化素特异结合的抗体。特别有用的抗TGF-β结合蛋白抗体与SEQ ID NO2、6、8、10、12、14、16、46、或65的TGF-β结合蛋白“特异结合”,但不与其它TGF-β结合蛋白诸如Dan、Cerberus、SCGF、或Gremlin结合。本发明的抗体(包括其片段和衍生物)可以是多克隆抗体,或者尤其是单克隆抗体。抗体可以属于任何免疫球蛋白类别,可以是例如IgG(包括IgG的同种型,对人而言本领域已知有IgG1、IgG2、IgG3、IgG4)、IgE、IgM、或IgA抗体。可以由禽类或哺乳动物获得抗体,优选例如从鼠、大鼠、人、或其它灵长类获得。如果需要,抗体可以是内在化抗体。
可以使用本领域技术人员众所周知的方法来制备针对重组TGF-β结合蛋白的多克隆抗体(参阅例如Green等,“多克隆抗血清的生成”(Production of Polyclonal Antisera),《免疫化学方案》(Immunochemical Protocols),Manson编,第1-5页,Humana出版社,1992年;Williams等,“使用质粒载体在大肠杆菌中表达外源蛋白并纯化特异多克隆抗体”(Expression of foreign proteins inE.coli using plasmid vectors and purification of specificpolyclonal antibodies),《DNA克隆2表达系统》(DNA Cloning2Expression systems),第2版,Glover等编,第15页,牛津大学出版社,1995年)。虽然多克隆抗体通常是在诸如大鼠、小鼠、兔、山羊、或绵羊等动物中产生的,但是本发明的抗TGF-β结合蛋白抗体也可以衍生自低于人类的灵长类抗体。用于在狒狒中形成在诊断和治疗上有用的抗体的通用技术参阅例如Goldenberg等,国际专利发表号WO 91/11465,1991年;和Losman等,Int.J.Cancer 46310,1990。
抗体应当包含至少一个可变区结构域。可变区结构域可以是任何大小或氨基酸组成,而且通常包含至少一个包埋在框架序列中、负责抗原结合的高变氨基酸序列。一般而言,术语可变区结构域(V)可以是免疫球蛋白重链(VH)和/或轻链(VL)可变区的任何合适排列。因此,例如,V区结构域可以是单体,而且是能够以可接受的亲和力与抗原独立结合的VH或VL结构域。或者,V区结构域可以是二聚体,而且包括VH-VH、VH-VL、或VL-VL二聚体,其中VH和VL链非共价相连(下文缩写为Fv)。然而,如果需要,两条链可以直接地(例如经由两个可变区之间的二硫键)或是通过接头(例如肽接头)而共价偶联,形成单链结构域(下文缩写为scFv)。
可变区结构域可以是任何天然存在的可变结构域或其改造形式。改造形式指使用重组DNA工程技术产生的可变区结构域。这些改造形式包括例如通过在天然抗体的氨基酸序列中进行插入、缺失、或改变而由天然抗体可变区产生的形式。这个类别的具体实例包括包含来自一种抗体的至少一个CDR和可选地一个或多个框架氨基酸、而剩余可变区结构域来自另一种抗体的改造后可变区结构域。
可变区结构域可以以C端氨基酸共价连接至少一个其它抗体结构域或其片段。因此,例如,当可变区结构域中存在VH结构域时,它可以与免疫球蛋白CH1结构域或其片段相连。类似的,VL结构域可以与CK结构域或其片段相连。这样的话,例如,抗体可以是Fab片段,其中抗原结合结构域包含其C端分别与CH1和CK结构域共价相连的关联VH和VL结构域。CH1结构域可以用氨基酸进一步延伸,以便例如提供在Fab′片段中发现的铰链区结构域,或提供其它结构域,诸如抗体CH2和CH3结构域。
抗体片段的另一种形式是编码单一互补决定区(CDR)的肽。可以通过构建编码目的抗体CDR的基因来获得CDR肽(“最小识别单位”)。例如,通过使用聚合酶链式反应,由抗体生成细胞的RNA合成可变区来制备这些基因(参阅例如Larrick等,MethodsA Companion toMethods in Enzymology 2106,1991;Courtenay-Luck,“单克隆抗体的基因操作”(Genetic Manipulation of MonoclonalAntibodies),《单克隆抗体生产、改造、和临床应用》(MonoclonalAntibodiesProduction,Engineering and ClinicalApplication),Ritter等编,第166页,剑桥大学出版社,1995年;和Ward等,“抗体的基因操作和表达”(Genetic Manipulation andExpression of Antibodies),《单克隆抗体原理和应用》(MonoclonalAntibodiesPrinciples and Applications),Birch等编,第137页,Wiley-Liss出版社,1995年)。
用于本发明的抗体通常是通过常规免疫和细胞融合流程制备的单克隆抗体,或是使用任何合适的标准化学技术诸如还原或酶促切割和/或消化技术(例如用胃蛋白酶处理)由其衍生的片段。更具体的说,可以采用多种技术来生成单克隆抗TGF-β结合蛋白抗体。可以通过本领域技术人员众所周知的方法来获得针对特定抗原的啮齿类单克隆抗体(参阅例如Kohler等,Nature 256495,1975;和Coligan等编,《免疫学通用方案》(Current Protocols in Immunology),12.5.1-2.6.7,John Wiley & Sons,1991[“Coligan”];Picksley等,“针对大肠杆菌中表达的蛋白质的单克隆抗体的生成”(Productionof monoclonal antibodies against proteins expressed in E.coli),《DNA克隆2表达系统》(DNA Cloning 2ExpressionSystems),第2版,Glover等编,第93页,牛津大学出版社,1995)。
简而言之,可以如下获得单克隆抗体给小鼠注射包含TGF-β结合蛋白基因产物的组合物,通过采集血清样品而确认抗体生成的存在,切除脾以获得B淋巴细胞,融合B淋巴细胞与骨髓瘤细胞以生成杂交瘤,克隆杂交瘤,选择生成针对该抗原的抗体的阳性克隆,培养生成针对该抗原的抗体的克隆,并由杂交瘤培养物分离所述抗体。
另外,本发明的抗TGF-β结合蛋白抗体可以衍生自人单克隆抗体。人单克隆抗体是由经过加工而响应于抗原激发生成特异人抗体的转基因小鼠获得的。在这种技术中,将人重链和轻链基因座元件导入由内源重链和轻链基因组包含靶向破坏的胚胎干细胞系衍生的小鼠品系。转基因小鼠能够合成对人抗原特异的人抗体,而且小鼠可用于生成分泌人抗体的杂交瘤。用于由转基因小鼠获得人抗体的方法参阅例如Green等,Nature Genet.713,1994;Lonberg等,Nature 368856,1994;和Taylor等,Int.Immun.6579,1994。
可以通过多种完全确立的技术由杂交瘤培养物分离和纯化单克隆抗体。这些分离技术包括使用蛋白A Sepharose的亲和层析、大小排阻层析、和离子交换层析(参阅例如Coligan,第2.7.1-2.7.12页和第2.9.1-2.9.3页;Baines等,“免疫球蛋白G(IgG)的纯化”(Purification of Immunoglobulin G(IgG)),《分子生物学方法》(Methods in Molecular Biology),第10卷,第79-104页,Humana出版公司,1992)。
对于特殊用途,可能需要制备抗TGF-β结合蛋白抗体的片段。可以通过例如抗体的蛋白水解来获得这些抗体片段。可以通过常规方法用胃蛋白酶或木瓜蛋白酶消化完整抗体来获得抗体片段。例如,可以通过酶促切割来生成抗体片段,例如用胃蛋白酶酶促切割抗体而生成5S片段,称为F(ab′)2。可以用硫醇还原剂进一步切割这个片段而生成3.5S Fab′单价片段。可选的是,可以使用由切割二硫键而生成的巯基的封闭基因进行切割反应。或者,使用胃蛋白酶的酶促切割直接产生两个单价Fab片段和一个Fc片段。这些方法参阅例如Goldenberg,美国专利号4,331,647;Nisonoff等,Arch Biochem.Biophys.89230,1960;Porter,Biochem.J.73119,1959;Edelman等,Methods in Enzymology 1422,Academic出版社,1967;和Coligan,第2.8.1-2.8.10页和2.10.-2.10.4。
还可以使用切割抗体的其它方法,诸如分离重链而形成单价轻链-重链片段,进一步切割片段,或者其它酶促、化学、或基因技术,只要片段能够与完整抗体所识别的抗原相结合即可。
或者,抗体可以是通过重组DNA技术获得的重组或改造的抗体,该技术涉及编码抗体可变区和/或恒定区的DNA的操作和再表达。这些DNA是已知的,和/或易于由DNA文库获得,包括例如噬菌体抗体库(参阅Chiswell,D.J.和McCafferty,J.,Tibtech.1080-84,1992),或者需要的话,可以人工合成。标准分子生物学和/或化学流程可用于DNA的测序和操作,例如,用于导入密码子以产生半胱氨酸残基,或是用于根据需要修饰、添加、或缺失其它氨基酸或结构域。
可以制备一种或多种包含编码可变区和/或恒定区的DNA的可复制型表达载体,并用于转化将在其中进行抗体生产的合适细胞系,例如非生产性骨髓瘤细胞系,诸如小鼠NSO系,或细菌,诸如大肠杆菌。为了获得有效转录和翻译,每个载体中的DNA序列应当包含合适的调控序列,特别是与可变结构域序列可操作相连的启动子和前导序列。用于以这种方式生成抗体的具体方法通常是众所周知且常规使用的。例如,基本的分子生物学流程参阅Maniatis等,《分子克隆》,冷泉港实验室,纽约,1989;DNA测序参阅Sanger等,Proc.Natl.Acad.Sci.USA 745463,1977;和Amersham国际上市公司测序手册;定点诱变的方法参阅Kramer等,Nucleic Acids Res.129441,1984;Anglian Biotechnology公司手册;Kunkel,Proc.Natl.Acad.Sci.USA 82488-92,1985;Kunkel等,Methods in Enzymol.154367-82,1987。另外,许多发表物详述了适用于通过操作DNA、生成表达载体、并转化合适细胞来制备抗体的技术,综述例如参阅Mountain,A.和Adair,J.R.,《生物技术和基因工程综述》Biotechnology and Genetic Engineering Reviews,Tombs,M.P.编,10,第1章,1992,Intercept,Andover,英国;和国际专利说明书编号WO 91/09967。
在某些实施方案中,依照本发明的抗体可以附着了一个或多个效应或报道分子,而且本发明延伸至这些经修饰的蛋白质。报道分子可以是可检测部分或标记物,诸如酶、细胞毒性剂、或其它报道分子,包括染料、放射性核素、发光基团、荧光基团、或生物素、诸如此类。可以放射性标记TGF-β结合蛋白特异性免疫球蛋白或其片段以用于诊断或治疗应用中。本领域知道用于放射性标记抗体的技术。参阅例如Adams,1998,In Vivo 1211-21;Hiltunen,1993,Acta Oncol.32831-9。下文更为详细的描述了治疗性应用,而且可以包括与其它治疗剂一起使用TGF-β结合蛋白特异性抗体(或其片段)。可以将效应或报道分子通过任何可供利用的氨基酸侧链、末端氨基酸、或抗体中存在的碳水化合物功能基团(如果有的话)附着于抗体上,条件是这种附着或附着过程不会对该分子的结合特性和效用产生不利影响。具体的功能基团包括例如任何游离氨基、亚氨基、硫醇基、羟基、羧基、或醛基。抗体与效应和/或报道分子的附着可以经由效应或报道分子中的这些基团和合适功能基团来实现。连接可以是直接的,或者经由间隔或架桥基团而间接连接。
效应分子包括例如抗肿瘤剂、毒素(诸如细菌(诸如铜绿假单胞菌外毒素A)或植物来源的酶促活性毒素及其片段(例如蓖麻毒素及其片段;植物白树毒素,来自Bryonia dioica的bryodin,诸如此类。参阅例如Thrush等,Annu.Rev.Immunol.1449-71,1996;Frankel等,Cancer Res.56926-32,1996);生物学活性蛋白,例如酶;核酸及其片段诸如DNA、RNA及其片段;天然存在的和合成的聚合物(例如多糖和聚烯烃聚合物诸如聚乙二醇及其衍生物);放射性核素,特别是放射性碘化物;和螯合金属。合适的报道基团包括螯合金属、荧光化合物、或者可以通过NMR或ESR光谱学检测的化合物。特别有用的效应基团是加利车霉素(calichaemicin)及其衍生物(参阅例如南非专利说明书编号85/8794、88/8127、和90/2839)。
熟悉本领域的人知道众多其它毒素,包括化疗剂、抗有丝分裂剂、抗生素、凋亡诱导物(或“凋亡原”,参阅例如Green和Reed,Science2811309-1312,1998)诸如此类,本文提供的实例意图例示而非限制本发明的范围和精神。具体的抗肿瘤剂包括毒害细胞和抑制细胞的试剂,例如烷化剂,诸如氮芥(例如苯丁酸氮芥、苯丙氨酸氮芥、二氯甲基二乙胺、环磷酰胺、或尿嘧啶氮芥)及其衍生物、三亚乙基磷酰胺、三亚乙基硫代磷酰胺、白消安、或顺铂;抗代谢物诸如氨甲蝶呤、氟尿嘧啶、氟尿苷、阿糖胞苷、巯基嘌呤、硫鸟嘌呤、氟乙酸或氟柠檬酸,抗生素诸如博来霉素(例如硫酸博来霉素)、阿霉素、道诺霉素、丝裂霉素(例如丝裂霉素C)、放线菌素(例如放线菌素D)、普卡霉素、加利车霉素(calichaemicin)及其衍生物、或埃斯波霉素(esperamicin)及其衍生物;有丝分裂抑制剂,诸如鬼臼亚乙苷、长春新碱、或长春碱及其衍生物;生物碱,诸如椭圆玫瑰树碱;多元醇,诸如紫杉萜酯-I或紫杉萜酯-II;激素,诸如雄激素(例如屈他雄酮或睾内酯)、孕激素(例如乙酸甲地孕酮或乙酸甲羟孕酮)、雌激素(例如二甲基己烯雌酚二磷酸、聚磷酸雌二醇、或雌氮芥磷酸)、或抗雌激素药(例如它莫西芬);蒽醌,诸如米托蒽醌;脲,诸如羟基脲;肼,诸如丙卡巴肼;或咪唑,诸如达卡巴嗪。
螯合金属包括配位数为2-8(含)的二价或三价金属螯合物。这些金属的具体实例包括锝(Tc)、铼(Re)、钴(Co)、铜(Cu)、金(Au)、银(Ag)、铅(Pb)、铋(Bi)、铟(In)、镓(Ga)、钇(Y)、铽(Tb)、钆(Gd)、和钪(Sc)。一般而言,金属优选是放射性核素。具体的放射性核素包括99mTc、186Re、188Re、58Co、60Co、67Cu、195Au、199Au、110Ag、203Pb、206Bi、207Bi、111In、67Ga、68Ga、88Y、90Y、160Tb、153Gd、和47Sc。
螯合金属可以是例如与任何合适多配位螯合剂螯合的上述金属类别之一,螯合剂是例如无环或环状多胺、聚醚(例如冠醚及其衍生物)、聚酰胺、卟啉、和碳环衍生物。一般而言,螯合剂的类型将取决于使用的金属。然而,在依照本发明的缀合物中特别有用的一类螯合剂包括无环和环状多胺,尤其是多氨基羧酸,例如二亚乙三胺五乙酸及其衍生物;大环胺,诸如环状三氮杂和四氮杂衍生物(例如国际专利说明书编号WO 92/22583中所述);和聚酰胺,尤其是去铁胺及其衍生物。
在将抗体中的硫醇基用作附着点时,这可以通过与效应或报道分子中存在的硫醇反应性基团的反应来实现。这些基团的实例包括á-卤代羧酸或酯诸如碘乙酰胺、酰亚胺诸如马来酰亚胺、乙烯基砜、或二硫化物。国际专利说明书编号WO 93/06231、WO 92/22583、WO90/091195、和WO 89/01476概括和更具体描述了这些和其它合适连接流程。
用于选择可增加骨密度的分子的测定法如上所述,本发明提供了用于选择和/或分离能够增加骨密度的化合物的方法。例如,在本发明的一个方面,提供了用于测定选择的分子(例如候选试剂)是否能够增加骨矿物质含量的方法,包括下列步骤(a)将选择的分子与TGF-β结合蛋白和选择的TGF-β蛋白家族成员混合(或接触),并(b)测定所选择的分子是否刺激TGF-β蛋白家族的信号传导,或是否抑制TGF-β结合蛋白与至少一种TGF-β蛋白家族成员结合。在某些实施方案中,该分子可增强TGF-β作为间充质细胞分化正调节物发挥功能的能力。
在本发明的其它方面,提供了用于测定选择的分子(候选试剂)是否能够增加骨矿物质含量的方法,包括下列步骤(a)将选择的分子暴露于(接触、混合、联合)表达TGF-β结合蛋白的细胞,并(b)测定暴露的细胞中TGF-β结合蛋白的表达(或活性)是否降低,或TGF-β结合蛋白的活性是否降低,并由此测定该化合物是否能够增加骨矿物质含量。在一个实施方案中,所述细胞选自来自骨活组织检查标本的自发转化或未转化的正常人骨和大鼠顶骨成骨细胞。用于检测TGF-β结合蛋白表达水平的方法可以以本领域已知的和本文描述的多种测定法形式来实现。可以使用免疫测定法来检测并量化TGF-β结合蛋白的表达,包括例如逆向免疫电泳(CIEP)、放射免疫测定法、放射免疫沉淀、酶联免疫吸附测定法(ELISA)、免疫印迹测定法诸如点印迹测定法和Western印迹、抑制或竞争测定法、以及三明治测定法(参阅美国专利号4,376,110和4,486,530;还可参阅《抗体实验室指南》AntibodiesA Laboratory Manual,见上文)。这些免疫测定法可以使用对TGF-β结合蛋白特异的抗体,诸如本文所述的抗硬化素抗体,或者可以使用对附着于TGF-β结合蛋白上的报道分子特异的抗体。还可以通过量化与TGF-β结合蛋白配体相结合的TGF-β结合蛋白的量来测定多肽表达水平。例如,可以通过表面激元共振(SPR)来检测样品中硬化素与BMP的结合。或者,可以量化编码该特定TGF-β结合蛋白的mRNA的表达水平。
下文实施例5和6提供了这些测定法的代表性实施方案。简而言之,首先将TGF-β超家族的家族成员或TGF-β结合蛋白结合在固相上,随后添加候选分子。然后向测定反应中添加经过标记的TGF-β超家族家族成员或TGF-β结合蛋白(即无论将哪种多肽结合在固相上,经过标记的多肽均是前者的配体),清洗固相,并测定固相支持物上结合的或标记的TGF-β超家族成员或TGF-β结合蛋白的量。适于如本文所述用于增加骨矿物质含量的分子是以统计学显著方式降低TGF-β结合蛋白与TGF-β超家族成员结合的那些分子。显然,适于在本发明中使用的测定法不应当受限于实施例2和3中描述的实施方案。具体而言,可以改变众多参数,诸如通过将TGF-β结合到固相上,或是通过完全取消固相。
在本发明的其它方面,提供了用于测定所选择的分子是否能够增加骨矿物质含量的方法,包括下列步骤(a)将选择的分子(候选试剂)暴露于(接触、混合、联合)表达TGF-β的细胞,并(b)测定由所述暴露的细胞表达的TGF-β的活性是否改变,并由此测定该化合物是否能够增加骨矿物质含量。与本文所述方法类似,可以采用非常多种方法来评估由选择的待测化合物引起的TGF-β结合蛋白表达的变化。在本发明的一个实施方案中,候选试剂是与本文所公开的TGF-β结合蛋白硬化素结合的抗体。
在本发明的一个优选实施方案中,提供了用于鉴定调控TGF-β信号传导途径的抗体的方法,包括在足以容许抗体+SOST(抗体/SOST)复合物形成的条件和时间下将与SOST多肽特异结合的抗体接触SOST肽,包括但不限于本文所公开的肽,然后测定SOST/抗体复合物的水平(例如对其量进行量化)以确定调控TGF-β信号传导途径的抗体的存在。可以使用SPR或本领域已知的和本文公开的任何不同免疫测定法来进行该方法,包括ELISA、免疫印迹、诸如此类。TGF-β信号传导途径包括这样的信号传导途径,BMP借助该途径与细胞上的I型和II型受体结合而刺激或诱导调控骨矿物质含量的途径。在本发明的某些优选实施方案中,与SOST特异结合的抗体刺激或增强用于增加骨矿物质含量的途径。可以使用本文所公开的用于检测抗体与SOST特异性肽结合的方法来鉴定这样的抗体。
本发明的方法还可以通过检测抗体是否与位于SOST上BMP所结合的区域或其部分内的SOST肽结合而用于鉴定削弱、抑制(包括竞争性抑制)、或阻止BMP与SOST多肽结合的抗体,所述SOST肽诸如是SOST氨基末端的肽和包含SOST氨基末端氨基酸残基及部分核心区(停泊核心)的肽(例如SEQ ID NO47-64、66-73、和92-95)。本发明的方法还可用于鉴定削弱、阻止、或抑制SOST均二聚体形成的抗体。可以通过检测抗体与衍生自SOST核心或羧基末端区的肽(例如SEQ IDNO74-91和96-99)的结合来鉴定与SOST特异结合的这种抗体。
在本发明的另一个实施方案中,提供了用于测定选择的分子是否能够增加骨矿物质含量的方法,包括下列步骤(a)将选择的分子(候选试剂)与TGF-β结合蛋白及选择的TGF-β蛋白家族成员相混合或接触,并(b)测定该选择的分子是否上调TGF-β蛋白家族的信号传导,或是否抑制TGF-β结合蛋白与TGF-β蛋白家族结合。在某些实施方案中,该分子可增强TGF-β作为间充质细胞分化正调节物发挥功能的能力。
与上文所述方法类似,可以采取非常多种方法来评估由选择的待测化合物引起的TGF-β刺激。下文实施例6中提供了这样的一种代表性方法(还可参阅Durham等,Endo.1361374-1380)。
在本发明的另一个方面,提供了用于测定选择的分子(候选试剂)是否能够增加骨矿物质含量的方法,包括测定选择的分子是否抑制TGF-β结合蛋白与骨或其类似物结合的步骤。在用于本文时,应当理解,骨或其类似物指羟磷灰石,或是由骨粉、碎骨、或完整骨组成的表面。与上文所述方法类似,可以采用非常多种方法来评估对TGF-β结合蛋白定位于骨基质的抑制。下文实施例7中描述了这样的一种代表性方法(还可参阅Nicolas等,Calcif.Tissue Int.47206-12,1995)。
在本发明的一个实施方案中,与硬化素多肽特异结合的抗体或其抗原结合片段能够竞争性抑制TGF-β家族成员与硬化素多肽结合。可以依照本文所述任何方法来测定所述抗体或抗体片段削弱或阻断TGF-β家族成员诸如BMP与硬化素结合的能力。与硬化素特异结合的抗体或其片段可能通过削弱硬化素均二聚体形成而削弱、阻断、或阻止TGF-β家族成员与硬化素结合。与硬化素特异结合的抗体还可用于通过抑制或削弱硬化素与BMP结合来鉴定硬化素活性。或者,可以将抗体或其片段掺入基于细胞的测定法中或其中硬化素具有确定活性的动物模型中,以测定该抗体是否改变(以统计学显著方式增加或减少)该活性。与硬化素特异结合的抗体或其片段可用于检验这种抗体在信号转导途径中的作用以及由此调控(刺激或抑制)信号传导途径的作用。优选的是,抗体与SOST的结合导致对信号传导途径的刺激或诱导。
虽然本文所述方法可以是对单个待测分子的分析,但是本发明不应当受限于此。具体而言,选择的分子可以包含在化合物混合物中。因此,所述方法还可以包括分离抑制TGF-β结合蛋白与TGF-β家族成员结合的分子的步骤。
候选分子可以对非常多种分子测定它们抑制TGF-β结合蛋白与TGF-β家族成员结合的能力。下文更为详细讨论的代表性实例包括有机分子(例如有机小分子)、蛋白质或肽、以及核酸分子。根据下文讨论显而易见的是,可以在本文所述测定法中采用本文所述候选分子,同样显而易见的是,还可以在多种诊断和治疗背景中采用这些分子。
1.有机分子可以对众多有机小分子测定它们抑制TGF-β结合蛋白与TGF-β家族成员结合的能力。例如,在本发明的一个实施方案中,合适的有机分子可以选自化学文库(其中单独测定化学药品),或是选自组合化学文库(其中一次测定多种化合物),然后拆分以确定并分离最有活性的化合物。
这些组合化学文库的代表性实例参阅Agrafiotis等,“自动生成具有期望特性的化学药品的系统和方法”(System and method ofautomatically generating chemical compounds with desiredproperties),美国专利号5,463,564;Armstrong,R.W.,“经由多成分组合阵列合成的使用来合成有机化合物的组合阵列”(Synthesisof combinatorial arrays of organic compounds through the useof multiple component combinatorial array syntheses),WO95/02566;Baldwin,J.J.等,“磺胺药物衍生物及其用途”(Sulfonamide derivatives and their use),WO 95/24186;Baldwin,J.J.等,“组合二氢苯并呲喃文库”(Combinatorialdihydrobenzopyran library),WO 95/30642;Brenner,S.,“用于制备组合文库的新试剂盒”(New kit for preparing combinatoriallibraries),WO 95/16918;Chenera,B.等,“与树脂结合的芳香族碳环化合物文库的制备”(Preparation of library of resin-boundaromatic carbocyclic compounds),WO 95/16712;Ellman,J.A.,“Solid phase and combinatorial synthesis of benzodiazepinecompounds on a solid support”,美国专利号5,288,514;Felder,E.等,“新型组合化合物文库”(Novel combinatorial compoundlibraries),WO 95/16209;Lerner,R.等,“编码的组合化学文库”(Encoded combinatorial chemical libraries),WO 93/20242;Pavia,M.R.等,“用于由结构多样性全体文库制备和选择制药学有用非肽化合物的方法”(A method for preparing and selectingpharmaceutically useful non-peptide compounds from astructurally diverse universal library),WO 95/04277;Summerton,J.E.和Weller,D.D.,“吗啉亚基组合文库和方法”(Morpholino-subunit combinatorial library and method),美国专利号5,506,337;Holmes,C.,“Methods for the Solid PhaseSynthesis of Thiazolidinones,Metathiazanones,and Derivativesthereof”,WO 96/00148;Phillips,G.B.和Wei,G.P.,“苯并咪唑的固相合成”(Solid-phase Synthesis of Benzimidazoles),Tet.Letters 374887-90,1996;Ruhland,B.等,“结构多样性β-内酰胺固相支持的组合合成”(Solid-supported CombinatorialSynthesis of Structurally Diverse β-Lactams),J.Amer.Chem.Soc.111253-4,1996;Look,G.C.等,“The Indentification ofCyclooxygenase-1 Inhibitors from 4-ThiazolidinoneCombinatorial Libraries”,Bioorg.and Med.Chem.Letters 6707-12,1996。
2.蛋白质和肽同样可以采用广泛的蛋白质和肽作为TGF-β结合蛋白与TGF-β家族成员结合的抑制剂的候选分子。
a.组合肽文库可以通过筛选组合肽文库获得作为TGF-β结合蛋白与TGF-β家族成员结合的推定抑制剂的肽分子。这些文库或是可以由本领域技术人员制备(参阅例如美国专利号4,528,266和4,359,535,以及专利合作条约发布号WO 92/15679、WO 92/15677、WO 90/07862、WO90/02809),或是可以由商业途径购买(例如New England Biolabs的Ph.D.TM噬菌体展示肽库试剂盒)。
b.抗体本发明提供了与硬化素多肽特异结合的抗体和使用这些抗体的方法。本发明还提供了可用于生成和分析这些抗体的硬化素多肽免疫原。所述抗体可用于阻断或削弱作为TGF-β结合蛋白的硬化素多肽与配体特别是骨形态发生蛋白的结合,而且还可阻断或削弱该硬化素多肽与一种或多种其它配体的结合。
诸如抑制TGF-β结合蛋白与一种或多种TGF-β蛋白家族成员(包括一种或多种骨形态发生蛋白(BMP))结合的抗体这样的分子应当理解为指例如通过消除或阻止TGF-β成员与TGF结合蛋白结合而使得激活TGF-β家族成员或BMP、或是使得TGF-β家族成员(包括一种或多种BMP)与它们各自的受体结合的分子。
本发明还提供了可用于生成和/或鉴定能够抑制、阻止、或削弱TGF-β结合蛋白硬化素与一种或多种BMP结合的抗体或其片段的肽和多肽免疫原。本发明还提供了可用于生成和/或鉴定能够抑制、阻止、或削弱(例如以统计学显著方式降低)硬化素均二聚体形成的抗体或其片段的肽和多肽免疫原。本发明的抗体可用于增加骨的矿物质含量和矿物质密度,由此改善导致骨矿物质含量流失的众多状况,包括例如疾病、遗传素质、导致骨使用缺乏的事故(例如由于骨折)、影响骨再吸收或杀死骨形成细胞的治疗剂、和正常衰老。
还可以通过依照本领域技术人员知道的和本文描述的方法分析TGF-β结合蛋白的一级、二级、和三级结构以确定更有可能在宿主动物中产生抗原性应答的氨基酸序列来选择可用于硬化素特异抗体的免疫和/或分析的多肽或肽。参阅例如Novotny,Mol.Immunol.28201-207,1991;Berzofsky,Science 229932-40,1985。建模和x射线晶体学数据也可用于预测和/或确定TGF-β结合蛋白的哪些部分或区域与TGF-β结合蛋白配体诸如BMP的哪些部分相互作用。可以设计并制备包含相互作用的那些部分或区域之内或周围的氨基酸序列的TGF-β结合蛋白肽免疫原。这些抗体可用于阻断或削弱TGF-β结合蛋白与相同配体结合,还可阻断或削弱TGF-β结合蛋白与一种或多种其它配体结合。
本发明所涵盖的抗体或其抗原结合片段包括能够与硬化素特异结合并竞争性抑制TGF-β多肽(诸如BMP)与硬化素结合的抗体。例如,本发明所涵盖的抗体竞争性抑制硬化素多肽与BMP上的BMP I型受体位点或BMP II型受体结合位点结合,或者竞争性抑制硬化素与BMP上的I型和II型受体结合位点二者结合。不希望受限于理论,当抗硬化素抗体竞争性抑制BMP多肽上的I型和/或II型结合位点与硬化素结合、由此阻断硬化素的拮抗活性时,BMP上的受体结合位点即可用于结合I型和II型受体,由此增加骨矿化。当该配体对的每一个配偶体都形成均二聚体时,通常存在TGF-β结合蛋白(诸如硬化素)与TGF-β多肽(诸如BMP)之间的结合相互作用。因此,除了使用硬化素特异抗体通过竞争性抑制硬化素与BMP结合来阻断、削弱、或阻止硬化素与BMP结合以外,硬化素特异抗体(还)可用于阻断或削弱硬化素均二聚体形成。
例如,在与人BMP-7的一个二聚体形成的复合物中分离到作为BMP拮抗剂、有能力以高亲和力与BMP结合的人头蛋白的一个二聚体(Zimmerman等,见上文),并通过多波长不规则衍射(MAD)进行了分析(Groppe等,Nature 420636-42,2002)。如上所述,这项研究揭示了头蛋白二聚体可以有效阻断BMP上的所有受体结合位点(两个I型和两个II型受体结合位点)。头蛋白上与BMP-7接触的氨基酸位置可用于其它TGF-β结合蛋白诸如硬化素(SOST)与BMP之间的相互作用的建模,由此有助于设计可以作为免疫原用于产生阻断或削弱这种相互作用的抗体的肽。
在本发明的一个实施方案中,与SOST多肽特异结合的抗体或其抗原结合片段可竞争性抑制SOST多肽与位于骨形态发生蛋白(BMP)上的BMP I型受体结合位点和BMP II型受体结合位点中至少其一或二者的结合。SOST上这些抗体与之结合的表位可以包含或包含于位于SOST多肽N端的连续氨基酸序列(SEQ ID NO46大约第1-56位氨基酸)。该多肽还可以包含连接N端区域与核心区域的短接头肽序列,例如SEQID NO92(人)和SEQ ID NO93(大鼠)中提供的多肽。人SOST(例如SEQ ID NO46)的较短的代表性N端肽序列包括SEQ ID NO47-51,而大鼠SOST(例如SEQ ID NO65)的较短的代表性N端肽序列包括SEQ ID NO57-60。
与SOST多肽特异结合并例如通过阻断或抑制与BMP上与一个或多个I型和II型受体结合位点对应的氨基酸结合而阻断或竞争性抑制SOST多肽与BMP结合的抗体也可与包含对应于SOST核心区域(SEQ IDNO46的大约第57-146位氨基酸)的氨基酸序列的肽特异结合。包含该核心区域的多肽还可包含在N端和C端之一或二者延伸的额外氨基酸,例如包含可用于将多肽与载体分子缀合的半胱氨酸残基。例如,人和大鼠SOST的代表性核心多肽分别包含SEQ ID NO94和SEQ ID NO95所示氨基酸序列。这些抗体还可与较短多肽序列结合。代表性人SOST核心肽序列提供于SEQ ID NO66-69,而代表性大鼠SOST核心序列提供于SEQ ID NO70-73。
在另一个实施方案中,与SOST多肽特异结合的抗体削弱(抑制、阻止、或阻断,例如以统计学显著方式降低)SOST均二聚体形成。因为SOST与BMP之间的相互作用可能涉及SOST的均二聚体和BMP的均二聚体,所以阻止或削弱SOST均二聚体形成的抗体因而可改变骨矿物质密度,优选增加骨矿物质密度。在一个实施方案中,与SOST核心区域结合的抗体可阻止均二聚体形成。这些抗体还可与包含对应于核心区域的连续氨基酸序列(例如SEQ ID NO74、75、和98(人SOST)以及SEQ ID NO76和99(大鼠SOST))的肽结合。与位于SOST多肽C端区域的表位(SEQ ID NO46或65的大约第147-190位氨基酸)结合的抗体也可削弱均二聚体形成。例如,代表性的人和大鼠SOSTC端多肽分别包含SEQ ID NO96和SEQ ID NO97所示氨基酸序列。这些抗体还可与较短多肽序列结合。代表性的人SOST C端肽序列提供于SEQ ID NO78-81,而代表性的大鼠SOST C端序列提供于SEQ IDNO86-88。
抗体可与之特异结合的本文所公开的SOST多肽和肽可以用作免疫原。本发明的这些免疫原可用于免疫动物以产生体液免疫应答,导致与位于BMP上的I型或II型受体结合位点或者二者(包括由SOST N端区域衍生的肽)特异结合或可阻止SOST均二聚体形成的抗体的生成。
可用作免疫原的这些SOST多肽和肽也可用于筛选包含抗体的样品的方法中,例如纯化抗体、抗血清、或细胞培养物上清液的样品或是可能包含一种或多种对SOST特异的抗体的任何其它生物学样品。这些肽还可用于从生物学样品中鉴定和选择一个或多个生成与SOST特异结合的抗体的B细胞的方法(例如噬斑形成测定法等等)中。然后可以将B细胞作为SOST特异抗体编码多核苷酸的来源,通过本领域知道的和本文描述的重组分子生物学技术进行克隆和/或修饰。
“生物学样品”在用于本文时在某些实施方案中指包含至少一种对SOST多肽特异的抗体的样品,而且可以通过由受试者或生物学来源获得血样、活组织检查样本、组织外植体、器官培养物、或者任何其它组织或细胞制品来获得生物学样品。样品还可以指其中形态学完整性或物理状态已经通过例如解剖、分解、溶解、分级、匀浆、生化或化学抽提、粉碎、冻干、超声、或用于处理衍生自受试者或生物学来源的样品的任何其它手段被破坏的组织或细胞制品。受试者或生物学来源可以是人或非人动物、原代细胞培养物(例如体外免疫的B细胞)、或适于培养的细胞系,包括但不限于包含染色体整合的或游离的重组核酸序列的遗传工程化细胞系、永生化或可永生细胞系、体细胞杂交细胞系、已分化或可分化细胞系、经转化细胞系、诸如此类。
还可以通过合成总体代表SOST多肽的整个多肽序列、但每个只是与系列内的另一种肽共有SOST氨基酸序列一部分的一系列肽来制备SOST肽免疫原。这种交叠部分将优选至少4个氨基酸,更优选5、6、7、8、9、或10个氨基酸。每种肽可用于免疫动物,由动物采集血清,并在测定法中进行测试以鉴定哪只动物生成削弱或阻断SOST与TGF-β蛋白结合的抗体。然后依照本领域知道的和本文描述的方法由这些经鉴定的免疫动物制备抗体。
根据本文提供的公开书可以容易的制备抑制TGF-β结合蛋白与TGF-β家族成员结合的抗体。特别有用的是与SEQ ID NO2、6、8、10、12、14、16、46、或65的TGF-β结合蛋白“特异结合”、但不与其它TGF-β结合蛋白(诸如Dan、Cerberus、SCGF、或Gremlin)结合的抗TGF-β结合蛋白抗体。在本发明的内容中,抗体理解为包括单克隆抗体、多克隆抗体、单链的、嵌合的、CDR移植的免疫球蛋白、抗独特型抗体、及其抗体片段(例如Fab、Fd、Fab′、和F(ab′)2、Fv可变区、和互补决定区)。如上所述,若抗体以大于或等于107M-1、优选大于或等于108M-1的Ka与TGF-β结合蛋白结合,且与其它TGF-β结合蛋白不结合或者以小于或等于106M-1的Ka结合,则理解为该抗体是对所述TGF-β结合蛋白特异的,或是对该特定TGF-β家族成员是特异的。抗体对其相关抗原的亲和力还常常表述为解离常数KD,而且,若抗SOST抗体以小于或等于大约10-5M、更优选小于或等于大约10-6M、仍然更优选小于或等于大约10-7M、且仍然更优选小于或等于大约10-8M的KD与TGF-β家族成员结合,则该抗SOST抗体与该TGF-β家族成员可特异结合。另外,本发明的抗体优选阻断、削弱、或抑制(例如以统计学显著性降低)TGF-β结合蛋白与TGF-β家族成员结合。本领域普通技术人员可以容易的测定单克隆抗体或结合配偶体的亲和力以及对结合的抑制(参阅Scatchard,Ann.N.Y.Acad.Sci.51660-672,1949)。还可以通过表面激元共振(SPR;BIAcore,Biosensor,皮斯卡塔韦,新泽西)来测定亲和力。对于表面激元共振,可将靶分子固定在固相上,并暴露于沿流动槽流过的流动相中的配体。如果发生配体与固定化靶的结合,那么局部折射率发生变化,导致SPR角发生变化,这可以通过检测折射光的强度变化来实时监测。可以分析SPR信号的变化速率以得到结合反应的结合和解离相的表观速率常数。这些数值的比率就是表观平衡常数(亲和力)(参阅例如Wolff等,Cancer Res.532560-65,1993)。
依照本发明的抗体可以属于任何免疫球蛋白类别,例如IgG、IgE、IgM、IgD、或IgA,而且可以是构成一个类别的不同同种型之任一(诸如人IgG类别的IgG1、IgG2、IgG3、和IgG4)。它可以由动物获得或衍生,例如禽类(例如鸡)和哺乳动物,包括但不限于小鼠、大鼠、仓鼠、兔、或其它啮齿类、牛、马、绵羊、山羊、骆驼、人、或其它灵长类。抗体可以是内在化抗体。
可以使用本领域众所周知的方法来生成对TGF-β结合蛋白(诸如SOST)特异的抗体、多克隆抗血清、或单克隆抗体。还可以生成这样的抗体,即设计成具有期望特性的基因工程化免疫球蛋白(Ig)或Ig片段。例如,作为例示而非限制,抗体可以包括重组IgG,它是嵌合的融合蛋白,具有至少一个来自第一种哺乳动物物种的可变区(V)结构域和至少一个来自第二种不同哺乳动物物种的恒定区结构域。最常见的是,嵌合抗体具有鼠源可变区序列和人源恒定区序列。这样的鼠/人嵌合免疫球蛋白可以是通过将赋予对抗原的结合特异性的由鼠抗体衍生的互补决定区(CDR)移植到由人衍生的V区框架区和由人衍生的恒定区中而“人源化”的。可以通过蛋白水解消化或可选地通过蛋白水解消化后继以二硫键的温和还原和烷化来生成这些分子的片段。或者,还可以通过重组遗传工程技术来生成这些片段。
某些优选抗体是在本文所述体外测定法中抑制或阻断TGF-β结合蛋白活性的那些抗体。通常可以使用免疫检测方法来测定抗体对TGF-β结合蛋白的结合特性,包括例如可以由本领域普通技术人员容易执行的酶联免疫吸附测定法(ELISA)、免疫沉淀、免疫印迹、逆向免疫电泳、放射免疫测定法、斑点印迹测定法、抑制或竞争测定法、诸如此类(参阅例如美国专利号4,376,110和4,486,530;Harlow等,《抗体实验室指南》AntibodiesA Laboratory Manual,冷泉港实验室,1988)。
免疫原可以包括表达TGF-β结合蛋白的细胞、纯化或部分纯化的TGF-β结合多肽、或者其变体或片段(即肽),或者由TGF-β结合蛋白衍生的肽。可以通过蛋白水解切割较大多肽,或者通过重组分子方法学来生成这些肽,或者可以化学合成。例如,本文提供了编码TGF-β结合蛋白的核酸序列,由此本领域技术人员能够常规制备TGF-β结合蛋白以用作免疫原。可以通过本文描述的和本领域知道的方法化学合成肽。或者,可以通过蛋白水解切割TGF-β结合蛋白而生成肽,并通过本领域知道的方法分离单个肽,诸如聚丙烯酰胺凝胶电泳或任何数目的液相层析或其它分离方法。可用作免疫原的肽通常可能具有来自TGF-β结合蛋白氨基酸序列(诸如本文所述)的至少4或5个连续氨基酸且优选具有TGF-β结合蛋白的至少6、7、8、9、10、11、12、14、15、16、18、19、或20个连续氨基酸的氨基酸序列。某些其它优选肽免疫原包含TGF-β结合蛋白序列的至少6个、但不超过12个或更多连续氨基酸,而其它优选肽免疫原包含SOST多肽的至少21个但不超过50个连续氨基酸。其它优选肽免疫原包含TGF-β结合蛋白序列的21-25个、26-30个、31-35个、36-40个、41-50个、或21与100之间(含)、100与190(含)之间任何整数数目的连续氨基酸。
正如本文所公开的,本领域普通技术人员可以容易的由多种温血动物生成多克隆抗体,诸如马、牛、多种禽类、兔、小鼠、绵羊、山羊、狒狒、或大鼠。通常,与佐剂诸如弗氏完全或不完全佐剂或是Ribi佐剂系统(Corixa公司,西雅图,华盛顿)一起,通过腹膜内、肌肉内、眼内、皮内、或皮下注射,用TGF-β结合蛋白或其13-20个氨基酸或本文所述(优选通过戊二醛的交联与匙孔_血蓝蛋白缀合)的独特肽免疫动物。还可参阅例如Harlow等,见上文。一般而言,在第一次注射后,动物将依照可以根据抗原、佐剂(如果有的话)、和/或具体动物物种等而改变的优选方案接受一次或多次加强免疫。可以通过对动物定期采血并在免疫测定法中制备和分析血清以测定特异抗体滴度来监测免疫应答,所述免疫测定法诸如ELISA或Ouchterlony扩散测定法等等。特别优选的多克隆抗血清将在这些测定法之一(诸如ELISA)中给出可检测信号,优选比背景高至少3倍。一旦动物的滴度在其对所述蛋白质的反应性方面达到了稳定状态,就可以通过每周采血或通过给动物放血而容易地获得较大量的抗血清。
然后可以由这些血清纯化与TGF-β结合蛋白或肽特异结合的多克隆抗体,例如通过使用蛋白A的亲和层析。或者,可以进行这样的亲和层析,其中将TGF-β结合蛋白或肽或是对特定经免疫动物物种的Ig恒定区特异的抗体固定在合适的固相支持物上。
可用于本发明的抗体包括通过本文描述的和本领域知道的常规免疫和细胞融合流程制备的单克隆抗体。可以使用常规技术容易的生成单克隆抗体(参阅例如Kohler等,Nature 256495,1975;Coligan等编,《免疫学通用方案》(Current Protocols in Immunology),12.5.1-2.6.7,John Wiley & Sons,1991[“Coligan”];美国专利号RE 32,011、4,902,614、4,543,439、和4,411,993,将它们收入本文作为参考;还可参阅《单克隆抗体,杂交瘤生物学分析的新尺度》(Monoclonal Antibodies,HybridomasA New Dimension inBiological Analyses),Plenum出版社,Kennett、McKearn、和Bechtol编,1980;和《抗体实验室指南》(AntibodiesA LaboratoryManual),Harlow和Lane编,冷泉港实验室出版社,1988,也将它们收入本文作为参考;Picksley等,“针对在大肠杆菌中表达的蛋白质的单克隆抗体的生成”(Production of monoclonal antibodiesagainst proteins expressed in E.coli),《DNA克隆2表达系统》(DNA Cloning 2Expression Systems),第2版,Glover等编,第93页,牛津大学出版社,1995)。可以使用任何合适的标准技术由它们衍生抗体片段,诸如蛋白水解消化或可选地蛋白水解消化(例如使用木瓜蛋白酶或胃蛋白酶)后继以二硫键的温和还原和烷化。或者,还可以通过重组遗传工程技术生成这些片段。
简而言之,在一个实施方案中,如本文所述,用TGF-β结合蛋白或其一个部分或一个区域,包括一个区域内的肽免疫受试者动物,诸如大鼠或小鼠或仓鼠。可以将该蛋白质与佐剂诸如弗氏完全或不完全佐剂或Ribi佐剂混合,以增加由此产生的免疫应答。初次免疫后1-3周,可以给动物再次免疫另一次加强免疫,并使用本文所述测定法测试与蛋白质的反应性。一旦动物在对所注射蛋白质的反应性方面达到了稳定状况,即处死动物,并收获包含大量B细胞的器官,诸如脾和淋巴结。将收获的脾和/或淋巴结细胞悬浮液与合适的药物敏化骨髓瘤细胞融合,以产生分泌单克隆抗体的“杂交瘤”。合适的骨髓瘤系包括例如NS-0、SP20、NS-1(ATCC No.TIB 18)、和P3×63-Ag8.653(ATCC No.CRL 1580)。
可以将淋巴样(例如脾)细胞和骨髓瘤细胞与膜融合促进剂诸如聚乙二醇或非离子去污剂一起混合数分钟,然后以低密度涂布在支持杂交瘤细胞生长但不支持未融合的骨髓瘤细胞生长的选择培养基上。融合后,可以将细胞置于装有合适培养基(诸如RPMI 1640或DMEM(经Dulbecco氏修改的Eagles氏培养基)(JRH Biosciences,列涅萨,堪萨斯)以及额外成分诸如胎牛血清(FBS,即购自Hyclone,洛根,犹他或JRH Biosciences))的培养皿中。另外,培养基应当含有选择性容许融合的脾和骨髓瘤细胞生长的试剂,诸如HAT(次黄嘌呤、氨基蝶呤、和胸苷)(Sigma Chemical公司,圣路易斯,密苏里)。大约7天后,可以筛选由此产生的融合细胞或杂交瘤,以确定与TGF-β结合蛋白(取决于使用的抗原)有反应性、且阻断、削弱、或抑制TGF-β结合蛋白与TGF-β家族成员结合的抗体的存在。优选生成与硬化素或其变体特异结合的单克隆抗体的杂交瘤。
有多种测定法可用于测定与本发明蛋白质有反应性的抗体的存在,包括例如逆向免疫电泳、放射免疫测定法、放射免疫沉淀、酶联免疫吸附测定法(ELISA)、斑点印迹测定法、western印迹、免疫沉淀、抑制或竞争测定法、和三明治测定法(参阅美国专利号4,376,110和4,486,530;还可参阅《抗体实验室指南》AntibodiesALaboratory Manual,Harlow和Lane编,冷泉港实验室出版社,1988)。通过例如有限稀释克隆或通过软琼脂噬斑分离来克隆杂交瘤,并再次测定。由此,可以分离出生成与期望蛋白质反应的抗体的杂交瘤。
可以由杂交瘤培养物的上清液分离来自杂交瘤培养物的单克隆抗体。用于生产鼠单克隆抗体的候选方法是将杂交瘤细胞注射到同基因小鼠(例如经过处理(例如降植烷引发)小鼠)的腹腔内,以促进含有单克隆抗体的腹水的形成。可以通过多种完全确立的技术来分离和纯化单克隆抗体。这些分离技术包括使用蛋白A Sepharose的亲和层析、大小排阻层析、和离子交换层析(参阅例如Coligan,第2.7.1-2.7.12页和第2.9.1-2.9.3页;Baines等,“免疫球蛋白G(IgG)的纯化”(Purification of Immunoglobulin G(IgG)),《分子生物学方法》(Methods in Molecular Biology),第10卷,第79-104页,Humana出版公司,1992)。可以使用根据抗体的具体特性(例如重链或轻链同种型、结合特异性等)选择的合适配体通过亲和层析来纯化单克隆抗体。固定在固相支持物上的合适配体的实例包括蛋白A、蛋白G、抗恒定区(轻链或重链)抗体、抗独特型抗体、和TGF-β结合蛋白或者其片段或变体。
另外,本发明的抗TGF-β结合蛋白抗体可以是人单克隆抗体。可以通过本领域普通技术人员熟悉的多种技术来生成人单克隆抗体。这些方法包括但不限于埃波二氏病毒(EBV)转化人外周血细胞(例如包含B淋巴细胞)、体外免疫人B细胞、融合来自经过免疫的携带插入的人免疫球蛋白基因的转基因小鼠的脾细胞、由人免疫球蛋白V区噬菌体文库进行分离、或本领域知道的和基于本文公开书的其它流程。例如,可以由经过改造而应答抗原刺激生成特异人抗体的转基因小鼠获得人单克隆抗体。用于由转基因小鼠获得人抗体的方法参阅例如Green等,Nature Genet.713,1994;Lonberg等,Nature 368856,1994;Taylor等,Int.Immun.6579,1994;美国专利号5,877,397;Bruggemann等,Curr.Opin.Biotechnol.8455-58,1997;Jakobovits等,Ann.N.Y.Acad.Sci.764525-35,1995。在这种技术中,将人重链和轻链基因座的元件导入由包含内源重链和轻链基因座靶向破坏的胚胎干细胞系衍生的小鼠品系(还可参阅Bruggemann等,Curr.Opin.Biotechnol.8455-58,1997)。例如,人免疫球蛋白转基因可以是在小鼠淋巴组织中进行B细胞特异性DNA重排和超变的微型基因构建体或酵母人工染色体上的转基因座(transloci)。可以通过免疫转基因小鼠来获得人单克隆抗体,然后它们可能生成对该抗原特异的人抗体。可以依照本文所述方法将经免疫的转基因小鼠的淋巴细胞用于生成分泌人抗体的杂交瘤。还可以由经免疫动物的血液获得含有人抗体的多克隆血清。
用于生成人TGF-β结合蛋白特异性单克隆抗体的另一种方法包括通过EBV转化使人外周血细胞永生化。参阅例如美国专利号4,464,456。这样的生成与TGF-β结合蛋白(或其变体或片段)特异结合的单克隆抗体的永生化B细胞系(或类淋巴母细胞细胞系)可以通过本文提供的免疫检测方法进行鉴定,例如ELISA,然后通过标准克隆技术进行分离。生成抗TGF-β结合蛋白抗体的类淋巴母细胞细胞系的稳定性可以依照本领域知道的方法通过将经转化细胞系与鼠骨髓瘤融合生成鼠-人杂交瘤细胞系而得到改进(参阅例如Glasky等,Hybridoma 8377-89,1989)。用于生成人单克隆抗体的还有一种方法是体外免疫,它包括用抗原引发人脾B细胞,随后将经引发的B细胞与异源杂合融合配偶体融合。参阅例如Boerner等,J.Immunol.14786-95,1991。
在某些实施方案中,依照本领域知道的(WO 92/02551;美国专利号5,627,052;Babcook等,Proc.Natl.Acad.Sci.USA 937843-48,1996)和本文描述的分子生物学技术,选择生成抗SOST抗体的B细胞并由该B细胞克隆轻链和重链可变区。优选通过选择生成与SOST特异结合的抗体的细胞而由脾、淋巴结、或外周血样品分离来自经免疫动物的B细胞。还可以由人分离B细胞,例如由外周血样品。用于检测生成具有期望特异性的抗体的单个B细胞的方法在本领域是众所周知的,例如通过噬斑形成、荧光激活的细胞分拣术、体外刺激及随后检测特异性抗体、诸如此类。用于选择生成特异抗体的B细胞的方法包括例如在含有SOST或其肽片段的软琼脂中制备B细胞的单细胞悬浮液。由B细胞生成的特异抗体与抗原的结合导致复合物的形成,它可以免疫沉淀物形式观察到。选择出生成特异抗体的B细胞后,可以依照本领域知道的和本文描述的方法通过分离并扩增DNA或mRNA来克隆该特异抗体基因。
对于特定用途,可能需要抗TGF-β结合蛋白抗体的片段。抗体片段F(ab′)2、Fab、Fab′、Fv、Fc、Fd保留了完整抗体的抗原结合位点,因而与同一表位结合。可以依照常规方法,通过例如抗体的蛋白水解例如胃蛋白酶或木瓜蛋白酶消化完整抗体,来获得由抗体衍生的这些抗原结合片段。例如,可以通过用胃蛋白酶酶促切割抗体以提供称为F(ab′)2的5S片段而生成抗体片段。还可以用硫醇还原剂进一步切割这个片段以生成3.5S Fab′单价片段。可选的是,可以使用针对由切割二硫键产生的巯基的封闭基团进行切割反应。或者,使用木瓜蛋白酶的酶促切割直接生成两个单价Fab片段和一个Fc片段。这些方法参阅例如Goldenberg,美国专利号4,331,647;Nisonoff等,Arch.Biochem.Biophys.89230,1960;Porter,Biochem.J.73119,1959;Edelman等,《酶学方法》(Methods in Enzymology)1422,Academic出版社,1967;和Coligan,第2.8.1-2.8.10页和第2.10.-2.10.4页。可以采用用于切割抗体的其它方法,诸如分离重链以形成单价轻链-重链片段(Fd),进一步切割片段,或者其它酶促、化学、或基因工程技术,只要片段与完整抗体所识别的抗原结合即可。
抗体片段还可以是像抗体那样与特定抗原结合而形成复合物的任何合成的或基因工程化蛋白质。例如,抗体片段包括由轻链可变区组成的分离片段、由重链和轻链可变区组成的“Fv”片段、其中轻链和重链可变区以肽接头相连的重组单链多肽分子(scFv蛋白)、和由模拟高变区的氨基酸残基组成的最小识别单位。本发明的抗体优选包含至少一个可变区结构域。可变区结构域可以是任何大小或氨基酸组成,而且通常包含至少一个负责抗原结合且与一个或多个框架序列相邻或处于同一读码框的高变氨基酸序列。在一般术语中,可变区(V)结构域可以是免疫球蛋白重链(VH)和/或轻链(VL)可变结构域的任何合适排列。因此,例如,V区结构域可以是单体,而且可以是能够以可接受的亲和力与抗原独立结合的VH或VL结构域。或者,V区结构域可以是二聚体,包括VH-VH、VH-VL、或VL-VL二聚体。优选的是,V区二聚体包含非共价相连的至少一个VH链和至少一个VL链(下文称为Fv)。如果需要,两条链可以共价偶联而形成单链(scFv),这种连接或是直接的,例如经由两个可变结构域之间的二硫键,或是通过接头,例如肽接头。
可变区结构域可以是任何天然存在的可变结构域或其加工形式。加工形式指使用重组DNA工程技术产生的可变区结构域。这些加工形式包括例如通过特定抗体氨基酸序列中的插入、缺失、或改变而由特定抗体可变区产生的那些形式。具体实例包括包含来自第一种抗体的至少一个CDR和可选地一个或多个框架氨基酸、而剩余可变区结构域来自第二种抗体的工程化可变区结构域。
可变区结构域可以在C端氨基酸共价连接至少一个其它抗体结构域或其片段。因此,例如,当可变区结构域中存在VH结构域时,它可以与免疫球蛋白CH1结构域或其片段相连。类似的,VL结构域可以与CK结构域或其片段相连。这样的话,例如,抗体可以是Fab片段,其中抗原结合结构域包含其C端分别与CH1和CK结构域共价相连的关联VH和VL结构域。CH1结构域可以用氨基酸进一步延伸,例如为了提供在Fab′片段中存在的铰链区或铰链区结构域的一部分,或是为了提供其它结构域,诸如抗体CH2和CH3结构域。
抗体片段的另一种形式是包含单个互补决定区(CDR)的肽。可以通过构建编码目的抗体的CDR的多核苷酸来获得CDR肽(“最小识别单位”)。例如,通过使用聚合酶链式反应,以抗体生成细胞的mRNA作为模板合成可变区,由此制备这些多核苷酸(参阅例如Larrick等,MethodsA Companion to Methods in Enzymology 2106,1991;Courtenay-Luck,“单克隆抗体的基因操作”(Genetic Manipulationof Monoclonal Antibodies),《单克隆抗体生产、改造、和临床应用》(Monoclonal AntibodiesProduction,Engineering andClinical Application),Ritter等编,第166页,剑桥大学出版社,1995年;和Ward等,“抗体的基因操作和表达”(Genetic Manipulationand Expression of Antibodies),《单克隆抗体原理和应用》(Monoclonal AntibodiesPrinciples and Applications),Birch等编,第137页,Wiley-Liss出版社,1995年)。
或者,抗体可以是通过使用重组DNA技术获得的重组或工程化抗体,该技术涉及编码抗体可变区和/或恒定区的DNA的操作和再表达。这些DNA是已知的和/或易于由DNA文库获得的,包括例如噬菌体-抗体文库(参阅Chiswell和McCafferty,Tibtech.1080-84,1992),或是需要的话,可以人工合成。标准分子生物学和/或化学流程可用于DNA的测序和操作,例如,用于导入密码子以产生半胱氨酸残基,或是用于根据需要修饰、添加、或缺失其它氨基酸或结构域。
还可以依照本发明生成对TGF-β结合蛋白特异的嵌合抗体,包括人源化抗体。嵌合抗体具有至少一个衍生自第一种哺乳动物物种的恒定区结构域和至少一个衍生自第二种不同哺乳动物物种的可变区结构域(参阅例如Morrison等,Proc.Natl.Acad.Sci.USA,816851-55,1984)。在优选实施方案中,可以通过将编码至少一个衍生自非人单克隆抗体的可变区结构域(诸如衍生自小鼠、大鼠、或仓鼠单克隆抗体的可变区)的多核苷酸序列克隆到包含编码至少一个人恒定区的核苷酸序列的载体中来构建嵌合抗体(参阅例如Shin等,MethodsEnzymol.178459-76,1989;Walls等,Nucleic Acids Res.212921-29,1993)。例如,可以将编码鼠单克隆抗体轻链可变区的多核苷酸序列插入包含编码人κ轻链恒定区序列的核苷酸序列的载体中。在分开的载体中,可以在与编码人IgG恒定区(例如人IgG1恒定区)的序列相同的读码框中克隆编码单克隆抗体重链可变区的多核苷酸序列。可以根据对特定抗体所期望的效应物功能(例如补体固定、与特定Fc受体结合、等)来选择特定的人恒定区。优选的是,构建的载体将转染到真核细胞中用于稳定表达嵌合抗体。本领域知道的用于生成嵌合抗体的另一种方法是同源重组(例如美国专利号5,482,856)。
可以对非人/人嵌合抗体进行进一步的基因工程改造以生成“人源化”抗体。这样的人源化抗体可以包含由非人哺乳动物物种的免疫球蛋白衍生的多个CDR、至少一个人可变框架区、和至少一个人免疫球蛋白恒定区。可用于设计人源化抗体的策略可包括例如(作为例示而非限制)鉴定与嵌合抗体中的非人框架区最同源的人可变框架区。不希望受限于理论,这样的策略可以增加人源化抗体保持对TGF-β结合蛋白的特异结合亲和力的可能性,在有些优选实施方案中,可以是对TGF-β结合蛋白或其变体或片段本质上相同的亲和力,而在某些其它优选实施方案中,可以是对TGF-β结合蛋白更高的亲和力。参阅例如Jones等,Nature 321522-25,1986;Riechmann等,Nature 332323-27,1988。因此,设计这样的人源化抗体可能包括测定非人可变区的CDR环构象和结构决定簇,例如通过计算机建模,然后将CDR环和决定簇与已知的人CDR环结构和决定簇进行比较。参阅例如Padlan等,FASEB 9133,-39,1995;Chothia等,Nature 342377-383,1989。计算机建模还可用于比较通过与非人可变区的序列同源性选择的人结构模板。参阅例如Bajorath等,Ther.Immunol.295-103,1995;EP-0578515-A3。若非人CDR的人源化导致结合亲和力降低,则计算机建模可能有助于鉴定能够通过定点或其它诱变技术改变以部分、完全、或超最佳(即提高到高于未人源化抗体的水平)恢复亲和力的特定氨基酸残基。本领域普通技术人员熟悉这些技术,而且容易的领会对这些设计策略的众多变化和修改。
用于制备人源化抗体的这样一种方法称为饰面(veneering)。在用于本文时,术语“饰面FR”和“重组饰面FR”指用人FR残基选择性取代例如啮齿类重链或轻链V区的FR残基,以提供包含本质上保留了所有天然FR多肽折叠结构的抗原结合位点的异种分子。饰面技术是基于这样的理解,即抗原结合位点的配体结合特征主要由重链和轻链CDR对在抗原结合表面内的结构和相对定位决定。Davies等,Ann.Rev.Biochem.59439-73,1990。因此,只有在其中CDR结构、它们彼此的相互作用、和它们与剩余V区结构域的相互作用得到小心维持的情况下,才可以保持人源化抗体的抗原结合特异性。通过使用饰面技术,可以用人残基选择性取代免疫系统易于遭遇的外部(例如溶剂可到达的)FR残基,以提供具有微弱免疫原性或是基本上无免疫原性的经饰面表面的杂合分子。
饰面方法利用了由Kabat等(《免疫学关心的蛋白质的序列》(Sequences of Proteins of Immunological Interest),第4版,美国健康和公共事业部,美国政府印刷厂,1987)编制的人抗体可变结构域、Kabat数据库更新、和其它可得到的美国和外国数据库(核酸和蛋白质二者)中可以获得的序列数据。可以由已知的人和鼠抗体片段的三维结构推导V区氨基酸的溶剂可及性。首先,将目的抗体分子可变结构域的FR与由上述来源获得的相应的人可变结构域FR序列进行比较。然后一个残基一个残基的比较最同源的人V区与相应的鼠氨基酸。使用本领域众所周知的重组技术,用人模块中存在的残基取代鼠FR中与人对应物不同的残基。只对至少部分暴露(溶剂可及)的部分进行残基转换,而且要注意可能对V区结构域三级结构有显著影响的氨基酸替代,诸如脯氨酸、甘氨酸和带电荷氨基酸。
通过这种方式,由此产生的“经饰面”抗原结合位点可被设计成保持啮齿类CDR残基、与CDR实质相邻的残基、经鉴定埋藏或大部埋藏(溶剂不可及)的残基、被认为参与重链和轻链结构域之间非共价(即静电和疏水)接触的残基、和被认为影响CDR环“规范的”三级结构的FR保守结构区的残基。然后将这些设计标准用于制备将抗原结合位点的重链和轻链二者的CDR联合到人中出现的FR中的重组核苷酸序列,它可用于转染哺乳动物细胞以表达展示啮齿类抗体分子抗原特异性的重组人抗体。
用于选择与TGF-β结合蛋白或其变体或片段特异结合的抗体的另一种方法是噬菌体展示。参阅例如Winter等,Annu.Rev.Immunol.12433-55,1994;Burton等,Adv.Immunol.57191-280,1994。可以在能够进行筛选以选择与TGF-β结合蛋白或其变体或片段特异结合的Ig片段(Fab、Fv、sFv、或其多聚体)的噬菌体载体中构建人或鼠免疫球蛋白可变区基因组合文库。参阅例如美国专利号5,223,409;William D.Huse等,“在噬菌体λ中生成免疫球蛋白集合的大型组合文库”(Generation of a Large Combinational Libraryof the Immunoglobulin Repertoire in Phage Lambda),Science 2461275-1281,1989年12月;还可参阅L.Sastry等,“在大肠杆菌中克隆免疫学集合以生成单克隆催化性抗体重链可变区特异cDNA文库的构建”(Cloning of the Immunological Repertoire inEscherichia coli for Generation of Monoclonal CatalyticAntibodiesConstruction of a Heavy Chain VariableRegion-Specific cDNA Libra ry),Proc.Natl.Acad.Sci.USA 865728-5732,1989年8月;还可参阅Michelle Alting-Mees等,“单克隆抗体表达文库杂交瘤的快速候选方法”(Monoclonal AntibodyExpression LibrariesA Rapid Alternative to Hybridomas),Strategies in Molecular Biology 31-9,1990年1月;Kang等,Proc.Natl.Acad.Sci.USA 884363-66,1991;Hoogenboom等,J.Mol.Biol.227381-388,1992;Schlebusch等,Hybridoma 1647-52,1997及其中引用的参考文献。可以由Stratagene(拉霍亚,加利福尼亚)获得的一种商品化系统能够通过重组技术生成抗体。简而言之,由B细胞群分离mRNA,并用于在λImmunoZap(H)和λImmunoZap(L)载体中生成重链和轻链免疫球蛋白cDNA表达文库。随后将阳性噬斑转变成能够由大肠杆菌高水平表达单克隆抗体片段的非溶胞质粒。或者,可以将包含多种编码Ig可变区片段的多核苷酸序列的文库插入丝状噬菌体的基因组,诸如M13或其变体,其读码框与编码噬菌体外壳蛋白的序列相同。融合蛋白可以是外壳蛋白与轻链可变区结构域和/或与重链可变区结构域的融合体。依照某些实施方案,还可在噬菌体颗粒上展示免疫球蛋白Fab片段(参阅例如美国专利号5,698,426)。可以单个筛选这些载体,或是共表达以形成Fab片段或抗体(参阅Huse等,见上文;还可参阅Sastry等,见上文)。
类似的,也可以采用常规酶促消化或掺入编码特异结合抗体的基因的可变区的重组DNA技术来构建抗体的部分或片段,诸如Fab和Fv片段。在一个实施方案中,使用针对可变区的核苷酸引物由生成目的单克隆抗体的杂交瘤扩增编码可变区的基因。这些引物可以由本领域普通技术人员合成,或是由商业途径购买。Stratagene(拉霍亚,加利福尼亚)出售针对小鼠和人可变区的引物,包括例如针对VHa、VHb、VHc、VHd、CHl、VL、和CL区的引物。这些引物可用于扩增重链或轻链可变区,然后可以分别将它们插入载体,诸如ImmunoZAPTMH或ImmunoZAPTML(Stratagene)。然后可以将这些载体导入大肠杆菌、酵母、或基于哺乳动物的系统以进行表达。可以使用这些技术生成大量的包含VH和VL结构域融合体的单链蛋白质(参阅Bird等,Science242423-426,1988)。另外,这些技术可用于将“鼠源”抗体变成“人”抗体,而不改变抗体的结合特异性。
在本发明的某些特定实施方案中,组合噬菌体文库也可用于非人可变区的人源化。参阅例如Rosok等,J.Biol.Chem.27122611-18,1996;Rader等,Proc.Natl.Acad.Sci.USA 958910-15,1998。可以通过本领域知道的和本文描述的免疫检测方法筛选噬菌体文库,以选择目的Ig可变区片段,并通过标准技术测定如此选择的噬菌体中插入的免疫球蛋白基因的DNA序列。参阅Sambrook等,《分子克隆实验室指南》(Molecular CloningA Laboratory Manual),冷泉港出版社,2001。然后可以将选择的Ig编码序列克隆到另一种合适载体中以表达Ig片段,或者可选地克隆到包含Ig恒定区的载体中以表达完整免疫球蛋白链。
在某些其它实施方案中,本发明涵盖多聚体抗体片段形式的SOST特异性抗体。有用的方法学通常参阅例如Hayden等,Curr Opin.Immunol.9201-12,1997;Coloma等,Nat.Biotechnol.15159-63,1997。例如,可以通过噬菌体技术生成多聚体抗体片段,以形成微型抗体(miniantibodies)(美国专利号5,910,573)或diabodies(Holliger等,Cancer Immunol.Immuno ther.45128-130,1997)。
在本发明的某些实施方案中,对SOST特异的抗体可以是作为胞内蛋白表达的抗体。这些胞内抗体也可称为intrabodies,而且包含Fab片段,或优选包含scFv片段(参阅例如Lecerf等,Proc.Natl.Acad.Sci.USA 984764-49,2001)。可以修饰CDR区侧翼的框架区以改进intrabody在胞内还原环境中的表达水平和溶解度(参阅例如Worn等,J.Biol.Chem.2752795-803,2000)。可以将intrabody导向特定细胞定位或细胞器,例如通过构建包含编码introbody可变区的多核苷酸序列的载体,该多核苷酸序列可以与编码细胞内特定靶抗原的多核苷酸序列可操作融合(参阅例如Graus-Porta等,Mol.CellBiol.151182-91,1995;Lener等,Eur.J.Biochem.2671196-205,2000)。可以通过技术人员可用的多种技术将intrabody导入细胞,包括经由基因治疗载体、或脂质混合物(例如ProvectinTM,Imgenex公司,圣迭哥,加利福尼亚)、或依照光化学内在化方法。
将氨基酸突变导入对TGF-β结合蛋白特异的免疫球蛋白分子可用于提高对TGF-β结合蛋白的特异性或亲和力,或是改变效应物功能。可以通过针对特定残基的定点诱变来生成对TGF-β结合蛋白具有更高亲和力的免疫球蛋白。计算机辅助的三维分子建模可用于鉴定有待改变以改进对TGF-β结合蛋白的亲和力的氨基酸残基。参阅例如Mountain等,Biotechnol.Genet.Eng.Rev.101-142,1992。或者,可以在M13噬菌体中构建CDR组合文库,并筛选具有改进亲和力的免疫球蛋白片段。参阅例如Glaser等,J.Immunol.1493903-3913,1992;Barbas等,Proc.Natl.Acad.Sci.USA 913809-13,1994;美国专利号5,792,456。
还可以通过定点诱变来改变效应物功能。参阅例如Duncan等,Nature 332563-64,1988;Morgan等,Immunology 86319-24,1995;Eghtedarzedeh-Kondri等,Biotechniques 23830-34,1997。例如,免疫球蛋白Fc部分上糖基化位点的突变可能改变免疫球蛋白固定补体的能力。参阅例如Wright等,Trends Biotechnol.1526-32,1997。恒定区结构域中的其它突变可能改变免疫球蛋白固定补体或影响抗体依赖性细胞毒性的能力。参阅例如Duncan等,Nature 332563-64,1988;Morgan等,Immunology 86319-24,1995;Sensel等,Mol.Immunol.341019-29,1997。
依照某些实施方案,可以将本文所述任何Ig分子的非人、人、或人源化重链和轻链可变区构建成单链Fv(scFv)多肽片段(单链抗体)。参阅例如Bird等,Science 242423-426,1988;Huston等,Proc.Natl.Acad Sci.USA 855879-5883,1988。可以通过将编码scFv多肽的多核苷酸序列以相同读码框与编码任何已知效应物蛋白的至少一种多核苷酸序列相连来生成多功能scFv融合蛋白。这些方法在本领域是已知的,参阅例如EP-B1-0318554、美国专利号5,132,405、美国专利号5,091,513、和美国专利号5,476,786。例如,效应物蛋白可以包括免疫球蛋白恒定区序列。参阅例如Hollenbaugh等,J.Immunol.Methods 1881-7,1995。效应物蛋白的其它实例是酶。作为非限制性实例,这样的酶可以提供治疗目的的生物学活性(参阅例如Siemers等,Bioconjug.Chem.8510-19,1997),或者可以提供诊断用途的可检测活性,诸如辣根过氧化物酶催化的多种众所周知的底物转变成可检测产物。scFv融合蛋白的还有一些其它实例包括Ig-毒素融合体,或免疫毒素,其中scFv多肽与毒素相连。
在某些实施方案中,可以将scFv或本文所述任何抗体片段与容许检测融合蛋白与抗原(例如TGF-β结合蛋白)之间的特异结合的肽或多肽结构域融合。例如,融合多肽结构域可以是用于通过本领域技术人员熟悉的多种技术来检测scFv融合蛋白与TGF-β结合蛋白的结合的亲和标签多肽。肽标签的实例包括亲和素、链霉亲和素、或His(例如多组氨酸)。检测技术还可以包括例如亲和素或链霉亲和素融合蛋白与生物素或生物素模拟序列的结合(参阅例如Luo等,J.Biotechnol.65225,1998及其中引用的参考文献)、用可检测模块(例如标记模块)直接共价修饰融合蛋白、融合蛋白与特定的经标记报道分子的非共价结合、包含具有酶活性的部分的融合蛋白对可检测底物的酶促修饰、或融合蛋白在固相支持物上的(共价或非共价)固定。可用于构建scFv融合蛋白的其它亲和多肽可以包括链霉亲和素融合蛋白(参阅例如WO 89/03422、美国专利号5,489,528、美国专利号5,672,691、WO 93/24631、美国专利号5,168,049、美国专利号5,272,254);亲和素融合蛋白(参阅例如EP 511,747);酶,诸如谷胱甘肽-S-转移酶;和金黄色葡萄球菌(Staphylococcus aureus)蛋白A多肽。
可以依照众所周知的用于核酸切割、连接、转化、和转染的多种流程,使用多种表达载体来扩增并表达编码与本文所述TGF-β结合蛋白特异结合的抗体或其片段的多核苷酸。由此,在某些实施方案中,优选在原核宿主中表达抗体片段,诸如埃希氏大肠杆菌(Escherichiacoli)(参阅例如Pluckthun等,Methods Enzymol.178497-515,1989)。在某些其它实施方案中,优选在真核宿主细胞中表达抗体或其片段,包括酵母(例如酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、和巴斯德毕赤酵母(Pichia pastoris))、动物细胞(包括哺乳动物细胞)、或植物细胞。合适的动物细胞的实例包括但不限于骨髓瘤(诸如小鼠NSO系)、COS、CHO或杂交瘤细胞。植物细胞的实例包括烟草、玉米、大豆和稻细胞。
一旦得到了合适的抗体,即可以通过本领域普通技术人员众所周知的许多技术进行分离或纯化(参阅《抗体实验室指南》AntibodiesA Laboratory Manual,Har1ow和Lane编,冷泉港实验室出版社,1988)。合适的技术包括肽或蛋白质亲和柱(包括使用附着于柱基质上的抗恒定区抗体)、HPLC或RP-HPLC、蛋白A或蛋白G柱上的纯化、或这些技术的任意组合。
c.突变的TGF-β结合蛋白正如此处和下文实施例(例如实施例8和9)中所述,与天然TGF-β结合蛋白竞争阻断特定TGF-β家族成员活性的能力的改变形式的TGF-β结合蛋白应当会导致骨密度增加。由此,与TGF-β家族成员结合、但不抑制TGF-β家族成员功能的TGF-β结合蛋白突变体将符合这下标准。突变体必须有效竞争TGF-β结合蛋白的内源抑制性功能。
d.蛋白质的生成本文所述多肽包括TGF结合蛋白硬化素及其变体和与硬化素特异结合的抗体或其片段。编码这些多肽的多核苷酸包括与所述基因和分离的核酸分子本质上相似的基因衍生物,以及(如果合适的话)由这些基因及其衍生物编码的蛋白质(包括肽和多肽)。在用于本文时,若(a)核苷酸序列衍生自上文所述基因和核酸分子的编码区,而且包括例如上文所述序列的一部分或序列的等位基因变异,或者编码抑制TGF-β结合蛋白与TGF-β家族成员结合的分子;(b)核苷酸序列能够在中等、高、或很高严谨度下与本发明的核苷酸序列杂交(参阅Sambrook等,《分子克隆实验室指南》Molecular CloningALaboratory Manual,第2版,冷泉港实验室出版社,纽约,1989);和/或(c)DNA序列由于(a)或(b)中所定义的DNA序列的遗传密码而是简并的,则认为该核苷酸序列是“本质上相似的”。另外,本文公开的核酸分子包括互补和非互补序列二者,条件是所述序列在其它方面达到本文所列标准。在本发明的内容中,高严谨度指标准杂交条件(例如5×SSPE、0.5%SDS,于65℃,或相当的条件)。
使用例如P/C Gene or Intelligenetics Suite(Intelligenetics,芒廷维尤,加利福尼亚)的疏水性绘图功能,或者依照Kyte和Doolittle(J.Mol.Biol.157105-132,1982)描述的方法,可以由主要翻译产物预测由本文所述核酸分子编码的蛋白质的结构。
可以以酸性或碱性盐或是中性形式制备本发明的蛋白质。另外,可以通过氧化或还原修饰个别氨基酸残基。此外,可以对氨基酸或核酸序列进行多种替代、缺失、或添加,其净效应是保持或者进一步增强或降低突变型或野生型蛋白质的生物学活性。此外,例如由于遗传密码的简并性,编码相同氨基酸序列的核苷酸序列中可能存在可观的变异。
本文公开的蛋白质的其它衍生物包括该蛋白质与其它蛋白质或多肽的缀合物。这可以通过例如合成N端或C端融合蛋白来实现,它们的添加有助于蛋白质的纯化或鉴定(参阅美国专利号4,851,341;还可参阅Hopp等,Bio/Technology 61204,1988)。或者,可以构建融合蛋白,诸如Flag_/TGF-β结合蛋白,以帮助蛋白质的鉴定、表达、和分析。
可以使用本文所述多种技术来构建本发明的蛋白质。另外,可以通过合成包含突变序列且侧翼为限制位点从而能够连接天然序列片段的寡核苷酸而在特定位置导入突变。连接后,由此产生的重建序列编码具有期望氨基酸插入、替代、或缺失的衍生物。
或者,可以采用由寡核苷酸介导的位点特异(或区段特异)诱变流程来提供特定密码子根据需要的替代、缺失、或插入遭到改变的改变后基因或核酸分子。上文所列用于产生改变的例示性方法描述于Walder等,Gene 42133,1986;Bauer等,Gene 3773,1985;Craik,BioTechniques,1985年1月,12-19;Smith等,《基因工程原理和方法》Genetic EngineeringPrinciples and Methods,Plenum出版社,1981;以及Sambrook等,见上文。还可以利用与所需缺失邻近的便利限制性内切酶位点来构建蛋白质的缺失或截短衍生物(例如可溶性胞外部分)。限制性消化后,可以补平粘端并重连DNA。上文所列用于产生改变的例示性方法公开于Sambrook等,《分子克隆实验室指南》Molecular CloningA Laboratory Manual,第2版,冷泉港实验室出版社,1989。
在本发明核酸分子中进行的突变优选保持编码序列的读码框。此外,突变将优选不产生在转录后能够杂交而生成二级mRNA结构诸如将对mRNA翻译产生不利影响的环或发夹的互补区。尽管可以预定突变位点,然而本质上不必预定突变的性质。例如,为了选择指定位点处突变体的最佳特征,可以在目标密码子处进行随机诱变,并对表达的突变体筛选生物学活性的获得或丧失或保持。或者,可以通过合成包含突变序列且其侧翼为限制位点从而能够连接天然序列片段的寡核苷酸而将突变导入特定位置。连接后,由此产生的重建序列编码具有期望氨基酸插入、替代、或缺失的衍生物。
还可以采用诸如PCR诱变、化学诱变(Drinkwater和Klinedinst,PNAS833402-3406,1986)、通过强迫核苷酸错掺(例如Liao和Wise,Gene 88107-111,1990)、或使用随机诱变寡核苷酸(Horwitz等,Genomee 3112-117,1989)等技术来构建编码本发明蛋白质的核酸分子。
本发明还提供了通过培养包含能够表达上文所述基因的载体的宿主细胞而进行的对上文所述基因和核酸分子的操作和表达。这些载体或载体构建体包括合成的或cDNA衍生的编码期望蛋白质的核酸分子,其可操作地连接合适的转录或翻译调控元件。合适的调控元件可以衍生自多种来源,包括细菌、真菌、病毒、哺乳动物、昆虫、或植物基因。合适调控元件的选择取决于选择的宿主细胞,而且可以由本领域普通技术人员容易的完成。调控元件的实例包括转录启动子和增强子或RNA聚合酶结合序列、转录终止子、和核糖体结合序列,包括翻译起始信号。
可以通过非常多种原核和真核宿主细胞容易的表达编码本文所述任何蛋白质的核酸分子,包括细菌、哺乳动物、酵母或其它真菌、病毒、昆虫、或植物细胞。用于转化或转染这些细胞以表达外源DNA的方法在本领域是众所周知的(参阅例如Itakura等,美国专利号4,704,362;Hinnen等,Proc.Natl.Acad.Sci.USA 751929-1933,1978;Murray等,美国专利号4,801,542;Upshall等,美国专利号4,935,349;Hagen等,美国专利号4,784,950;Axel等,美国专利号4,399,216;Goeddel等,美国专利号4,766,075;和Sambrook等,《分子克隆实验室指南》Molecular CloningA Laboratory Manual,第2版,冷泉港实验室出版社,1989;关于植物细胞参予Czako和Marton,Plant Physiol.1041067-1071,1994;和Paszkowski等,Biotech.24387-392,1992)。
适于执行本发明的细菌宿主细胞包括大肠杆菌、枯草芽孢杆菌、伤寒沙门氏菌(Salmonella typhimurium)以及假单胞菌属、链霉菌属和葡萄球菌属中的多个物种,以及本领域普通技术人员众所周知的和本文描述的许多其它细菌物种。细菌宿主细胞的代表性实例包括大肠杆菌DH5α(Stratagene,拉霍亚,加利福尼亚)。
细菌表达载体优选包含在宿主细胞中发挥功能的启动子、一种或多种可选择表型标记、和细菌复制起点。代表性启动子包括β-内酰胺酶(青霉素酶)和乳糖启动子系统(参阅Chang等,Nature 275615,1978)、T7RNA聚合酶启动子(Studier等,Meth.Enzymol.18560-89,1990)、λ启动子(Elvin等,Gene 87123-126,1990)、trp启动子(Nichols和Yanofsky,Meth.in Enzymology 101155,1983)、和tac启动子(Russell等,Gene 20231,1982)。代表性选择标记包括多种抗生素抗性标记,诸如卡那霉素或氨苄青霉素抗性基因。适于转化宿主细胞的许多质粒在本领域是众所周知的,包括例如pBR322(参阅Bolivar等,Gene 295,1977)、pUC质粒pUC18、pUC19、pUC118、pUC119(参阅Messing,Meth.in Enzymology 10120-77,1983;和Vieira和Messing,Gene 19259-268,1982)、以及pNH8A、pNH16a、pNH18a、和Bluescript M13(Stratagene,拉霍亚,加利福尼亚)。
适于执行本发明的酵母和真菌宿主细胞包括例如粟酒裂殖酵母(Saccharomyces pombe)、酿酒酵母(Saccharomyces cerevisiae)、毕赤酵母属(Pichia)或克鲁维酵母属(Kluyveromyces),以及曲霉属(Aspergillus)的多个物种(McKnight等,美国专利号4,935,349)。适用于酵母和真菌的表达载体包括例如用于酵母的YCp50(ATCC No.37419),以及amdS克隆载体pV3(Turnbull,Bio/Technology 7169,1989)、YRp7(Struhl等,Proc.Natl.Acad.Sci.USA 761035-1039,1978)、YEp13(Broach等,Gene 8121-133,1979)、pJDB249、和pJDB219(Beggs,Nature 275104-108,1978)及其衍生物。
在酵母中使用的优选启动子包括来自酵母糖酵解基因(Hitzeman等,J.Biol.Chem.25512073-12080,1980;Alber和Kawasaki,J.Mol.Appl.Genet.1419-434,1982)或乙醇脱氢酶基因(Young等,《为了化学药品的微生物基因工程》Genetic Engineering ofMicroorganisms for Chemicals,Hollaender等编,第355页,Plenum出版社,纽约,1982;Ammerer,Meth.Enzymol.101192-201,1983)的启动子。在真菌载体中有用的启动子的实例包括衍生自构巢曲霉(Aspergillus nidulans)糖酵解基因的启动子,诸如adh3启动子(McKnight等,EMBO J.42093-2099,1985)。表达单元还可以包含转录终止子。合适的终止子的实例是adh3终止子(McKnight等,见上文,1985)。
与细菌载体一样,酵母载体通常将包含选择标记,它可以是展示显性表型的多种基因之一,针对所述显性表型存在表型测定法能够选择转化子。优选的选择标记是补足宿主细胞营养缺陷、提供抗生素抗性、或使得细胞能够利用特定碳源的选择标记,包括1eu2(Broach等,同上)、ura3(Botstein等,Gene817,1979)、或his3(Struhl等,同上)。另一种合适的选择标记是cat基因,它赋予酵母细胞以氯霉素抗性。
用于转化真菌的技术在文献中是众所周知的,描述于例如Beggs,同上;Hinnen等,Proc.Natl.Acad.Sci.USA 751929-1933,1978;Yelton等,Proc.Natl.Acad.Sci.USA 811740-1747,1984;和Russell,Nature 301167-169,1983。宿主细胞的基因型可以包含遗传缺陷,其可通过表达载体上存在的选择标记得到弥补。具体宿主和选择标记的选择完全属于本领域普通技术人员的水平之内。
用于转化酵母的方案对于本领域普通技术人员而言是众所周知的。例如,可以通过制备酵母球状体(参阅Hinnen等,PNAS751929,1978)或者通过碱性盐诸如LiCl处理(参阅Itoh等,J.Bacteriology153163,1983)而容易的用DNA进行转化。还可以如Cullen等,Bio/Technology 5369,1987所述使用聚乙二醇来进行真菌转化。
病毒载体包括包含指导编码上文所述期望蛋白的分离核酸分子表达的启动子的那些载体。非常多种启动子可用于本发明的内容,包括例如诸如MoMLV LTR、RSV LTR、Friend MuLV LTR、腺病毒启动子(Ohno等,Science 265781-784,1994)、新霉素磷酸转移酶启动子/增强子、晚期细小病毒启动子(Koering等,Hum.Gene Therap.5457-463,1994)、疱疹TK启动子、SV40启动子、金属硫蛋白IIa基因增强子/启动子、巨细胞病毒立即早期启动子、和巨细胞病毒立即晚期启动子等启动子。在本发明的特别优选实施方案中,启动子是组织特异性启动子(参阅例如WO 91/02805;EP 0,415,731;和WO 90/07936)。合适的组织特异性启动子的代表性实例包括神经特异性烯醇化酶启动子、血小板衍生生长因子β启动子、骨形态发生蛋白启动子、人α-chimaerin启动子、突触蛋白I启动子和突触蛋白II启动子。除了上述启动子以外,可以使用其它病毒特异启动子(例如逆转录病毒启动子(包括上文所述启动子以及诸如HIV启动子等其它启动子)、肝炎、疱疹(例如EBV)、和细菌、真菌、或寄生虫(例如疟疾)特异性启动子,从而靶向受病毒、细菌、真菌、或寄生虫感染的特定细胞或组织。
适于执行本发明的哺乳动物细胞包括例如COS、CHO、SaOS、骨肉瘤、KS483、MG-63、原代成骨细胞、和人或哺乳动物骨髓基质。用于执行本发明的哺乳动物表达载体将包含能够指导克隆的基因、核酸分子、或cDNA转录的启动子。优选的启动子包括病毒启动子和细胞启动子。骨特异性启动子包括骨唾液酸蛋白的启动子和骨钙蛋白的启动子。病毒启动子包括巨细胞病毒立即早期启动子(Boshart等,Cell 41521-530,1985)、巨细胞病毒立即晚期启动子、SV40启动子(Subramani等,Mol.Cell.Biol.1854-864,1981)、MMTV LTR、RSV LTR、金属硫蛋白-1、腺病毒Ela。细胞启动子包括小鼠金属硫蛋白-1启动子(Palmiter等,美国专利号4,579,821)、小鼠Vκ启动子(Bergman等,Proc.Natl.Acad.Sci.USA 817041-7045,1983;Grant等,Nucleic Acids Res.155496,1987)、和小鼠VH启动子(Loh等,Cell 3385-93,1983)。启动子的选择将至少部分取决于期望的表达水平或待转染的受体细胞系。
这些表达载体还可以在启动子下游和编码目的肽或蛋白质的DNA序列上游包含一套RNA剪接位点。优选的RNA剪接位点可以由腺病毒/或免疫球蛋白基因获得。表达载体中还在目的编码序列下游包含多聚腺苷酸化信号。合适的多聚腺苷酸化信号包括来自SV40的早期或晚期多聚腺苷酸化信号(Kaufman和Sharp,同上)、来自腺病毒5E1B区的多聚腺苷酸化信号、和人生长激素基因终止子(DeNoto等,Nucleic Acids Res.93719-3730,1981)。表达载体可以在启动子与RNA剪接位点之间包含非编码性病毒前导序列,诸如腺病毒2三元前导序列。优选的载体还可以包含增强子序列,诸如SV40增强子。表达载体还可以包含编码腺病毒VA RNA的序列。合适的表达载体可以由商业来源获得(例如Stratagene,拉霍亚,加利福尼亚)。
可以通过例如磷酸钙介导的转染(Wigler等,Cell 14725,1978;Corsaro和Pearson,Somatic Cell Genetics 7603,1981;Graham和Van der Eb,Virology 52456,1973)、电穿孔(Neumann等,EMBO J.1841-845,1982)、或DEAE-葡聚糖介导的转染(Ausubel等编,《分子生物学通用方案》Current Protocols in MolecularBiology,John Wiley and Sons公司,纽约,1987)将包含克隆的DNA的载体构建体导入培养的哺乳动物细胞。为了鉴定稳定转染了载体或整合了克隆的DNA的细胞,通常将选择标记与目的基因或cDNA一起导入细胞中。在培养的哺乳动物细胞中使用的优选选择标记包括赋予药物(诸如新霉素、潮霉素、和氨甲蝶呤)抗性的基因。选择标记可以是可扩增选择标记。优选的可扩增选择标记是DHFR基因和新霉素抗性基因。选择标记的综述见Thilly,Mammalian Cell Technology,Butterworth出版社,斯托纳姆,马萨诸塞,将其收入本文作为参考。
将包含合适载体的哺乳动物细胞培养一段时间,通常是1-2天,从而开始表达目的DNA序列。然后进行药物选择以选择出以稳定方式表达该选择标记的细胞的生长。对于用可扩增的选择标记转染的细胞而言,可以逐步提高药物浓度以选择克隆的序列的拷贝数增加,从而提高表达水平。对表达所导入序列的细胞选择和筛选目的蛋白以期望形式或期望水平的生成。然后可以克隆满足这些标准的细胞,并放大规模用于生产。
用于转染哺乳动物细胞的方案对于本领域普通技术人员而言是众所周知的。代表性方法包括磷酸钙介导的转染、电穿孔、脂转染、逆转录病毒、腺病毒、和原生质体融合介导的转染(参阅Sambrook等,见上文)。还可以在注射到哺乳动物(或其它动物)的肌肉中后由肌肉细胞或其它合适细胞摄取裸露的载体构建体。
使用昆虫细胞和植物宿主细胞来生产多肽的方法在本领域是知道的,而且本文有所描述。本领域知道的众多昆虫宿主细胞也可用于本发明。例如,关于以杆状病毒为载体在昆虫细胞中表达异源DNA序列的综述参阅Atkinson等,Pestic.Sci.28215-224,1990。本领域知道的众多载体和植物宿主细胞也可用于本发明,例如以发根农杆菌(Agrobacterium rhizogenes)为载体在植物细胞中表达基因和核酸分子(其综述参阅Sinkar等,J.Biosci.Bangalore 1147-58,1987)。
在本发明的相关方面,可以在转基因动物中表达本发明的蛋白质,所述转基因动物的生殖细胞和体细胞中包含编码期望蛋白质的基因,其可操作连接有效表达该基因的启动子。或者,可以以相似方式制备缺乏期望基因的转基因动物(例如“敲除”小鼠)。可以在多种非人动物中制备这些转基因动物,包括小鼠、大鼠、兔、绵羊、狗、山羊、和猪(参阅Hammer等,Nature 315680-683,1985;Palmiter等,Science 222809-814,1983;Brinster等,Proc.Natl.Acad.Sci.USA 824438-4442,1985;Palmiter和Brinster,Cell 41343-345,1985;和美国专利号5,175,383、5,087,571、4,736,866、5,387,742、5,347,075、5,221,778、和5,175,384)。简而言之,将包含待表达核酸分子及位于适当位置的表达控制序列的表达载体导入受精卵的原核,例如通过显微注射。通过对组织样品的DNA进行印迹分析来检测所注射DNA的整合。优选导入的DNA被掺入到动物的生殖系,使得它传代给动物后代。可以通过组织特异启动子或是通过能够调控地表达转基因的可诱导启动子诸如金属硫蛋白基因启动子(Palmiter等,1983,见上文)来实现组织特异表达。
可以例如如下纯化蛋白质培养合适的宿主和载体系统以生成本文所述重组翻译产物;然后通过多种纯化流程处理来自这些细胞系的上清液、或蛋白质包涵体、或不将蛋白质分泌到上清液中的完整细胞,以分离期望的蛋白质。例如,首先使用商品化蛋白质浓缩滤器诸如Amicon或Millipore Pellicon超滤单元浓缩上清液。浓缩后,可以将浓缩液施加到合适的纯化基质上,诸如例如结合于合适支持物上的抗蛋白质抗体(例如与待分离的多肽特异结合的抗体)。或者,可以采用阴离子或阳离子交换树脂来纯化蛋白质。再或者,可以采用一次或多次反相高效液相层析(RP-HPLC)步骤来进一步纯化蛋白质。分离本发明蛋白质的其它方法在本领域是众所周知的。
可以通过本领域知道的和本文描述的技术来测定分离的多肽的纯度,诸如凝胶电泳和层析方法。优选的是,这些分离的多肽是至少大约90%纯、更优选至少大约95%纯、且最优选至少大约99%纯。在某些特定实施方案中,若根据SDS-PAGE分析及随后考马斯蓝染色没有检测到其它非期望蛋白质,则在本发明的内容中认为蛋白质是“分离的”。在其它实施方案中,可以分离期望的蛋白质,使得根据SDS-PAGE分析及随后银染不会检测到其它非期望蛋白质。
3.核酸分子在本发明的其它方面,提供了能够抑制TGF-β结合蛋白与TGF-β家族成员结合的核酸分子。例如,在一个实施方案中,提供了特异抑制TGF-β结合蛋白核酸序列表达的反义寡核苷酸分子(通常参阅Hirashima等,《RNA分子生物学新观点》(Molecular Biology ofRNANew Perspectives),M.Inouye和B.S.Dudock编,1987,Academic出版社,圣迭戈,第401页;寡核苷酸基因表达的反义抑制物(OligonucleotidesAntisense Inhibitors of Gene Expression),J.S.Cohen编,1989,MacMillan出版社,伦敦;Stein和Cheng,Science2611004-1012,1993;WO 95/10607;美国专利号5,359,051;WO92/06693;和EP-A2-612844)。简而言之,构建这些分子,使得它们与转录的TGF-β结合蛋白mRNA序列的一个区域互补并能够形成Watson-Crick碱基配对。由此产生的双链核酸干扰mRNA的后续加工,从而阻止蛋白质表达(见实施例10)。
在本发明的其它方面,提供了能够抑制TGF-β结合蛋白与TGF-β家族成员结合的核酶。在用于本文时,“核酶”意欲包括包含用于特异识别的反义序列和RNA切割酶活性的RNA分子。催化链在较高化学计量浓度下切割靶RNA中的特定位点。非常多种核酶可用于本发明中,包括例如锤头核酶(例如Forster和Symons,Cell 48211-220,1987;Haseloff和Gerlach,Nature 328596-600,1988;Walbot和Bruening,Nature 334196,1988;Haseloff和Gerlach,Nature334585,1988中所述);发夹核酶(例如Haseloff等,1993年10月19日发布的美国专利号5,254,678;和Hempel等,1990年3月26日发布的欧洲专利发布号0 360 257中所述);和基于四膜虫核糖体RNA的核酶(参阅Cech等,美国专利号4,987,071)。本发明的核酶通常由RNA组成,但是也可以由DNA、核酸类似物(例如硫代磷酸酯)、或其嵌合体(例如DNA/RNA/RNA)组成。
4.标记物可以用多种化合物标记上文和下文所述基因产物或任何候选分子,包括例如荧光分子、毒素、和放射性核素。荧光分子的代表性实例包括荧光素、Phycobili蛋白质诸如藻红蛋白、罗丹明、Texas红、和萤光素酶。毒素的代表性实例包括蓖麻毒素、相思豆毒素、白喉毒素、霍乱毒素、gelonin、美洲商陆抗病毒蛋白、tritin、志贺氏杆菌毒素、和假单胞菌外毒素A。放射性核素的代表性实例包括Cu-64、Ga-67、Ga-68、Zr-89、Ru-97、Tc-99m、Rh-105、Pd-109、In-111、I-123、I-125、I-131、Re-186、Re-188、Au-198、Au-199、Pb-203、At-211、Pb-212、和Bi-212。另外,上文所述抗体也可以标记或缀合配体结合对中的一种配偶体。代表性实例包括亲和素-生物素、链霉亲和素-生物素、和核黄素-核黄素结合蛋白。
本领域普通技术人员可以容易的完成用于用上文所列代表性标记物缀合或标记本文所述分子的方法(参阅单端孢霉烯抗体缀合物Trichothecene Antibody Conjugate,美国专利号4,744,981;抗体缀合物(Antibody Conjugate),美国专利号5,106,951;荧光物质和标记技术(Fluorogenic Materials and Labeling Techniques),美国专利号4,018,884;用于诊断和治疗的金属放射性核素标记的蛋白质(Metal Radionuclide Labeled Proteins for Diagnosis andTherapy),美国专利号4,897,255;和用于改进螯合动力学的金属放射性核素螯合的化合物(Metal Radionuclide Chelating Compoundsfor Improved Chelation Kinetics),美国专利号4,988,496;还可参阅Inman,《酶学方法,第34卷,亲和技术、酶纯化第二部分》(Methods In Enzymology,Vol.34,Affinity Techniques,EnzymePurification)Part B,Jakoby和Wilchek编,Academic出版社,纽约,第30页,1974;还可参阅Wilchek和Bayer,“生物分析应用中的亲和素-生物素复合物”(The Avidin-Biotin Complex inBioanalytical Applications),Anal.Biochem.1711-32,1988)。
药物组合物如上所述,本发明还提供了包含上文所述抑制TGF-β结合蛋白与TGF-β家族成员结合的分子之一以及制药学或生理学可接受载体、赋形剂、或稀释剂的多种药物组合物。一般而言,这些载体在所采用的剂量和浓度对受者而言应当是无毒的。通常,这些组合物的制备需要组合治疗剂与缓冲剂、抗氧化剂诸如抗坏血酸、低分子量(小于大约10个残基)多肽、蛋白质、氨基酸、包括葡萄糖、麦芽糖、蔗糖、或糊精在内的碳水化合物、螯合剂诸如EDTA、谷胱甘肽和其它稳定剂、和赋形剂。合适稀释剂的实例是与非特异血清清蛋白混合的中性缓冲盐水或盐水。
可以制备本发明的药物组合物以用于提供多种不同路径的施用。一般而言,根据施用模式来选择载体的类型。可以配制药物组合物以用于任何合适的施用方式,包括例如局部、口服、鼻、鞘内、直肠、阴道、舌下、或肠胃外施用,包括皮下、静脉内、肌肉内、胸骨内、海绵体内、intrameatal、或尿道内注射或输液。药物组合物(例如用于口服施用或通过注射来投递)可以是液体的形式(例如酏剂、糖浆、溶液、乳状液、或悬浮液)。液体药物组合物可以包含例如一种或多种下列成分无菌稀释剂诸如注射用水、盐水溶液、优选生理盐水、Ringer氏溶液、等渗氯化钠、可以担当溶剂或悬浮介质的不挥发油、聚乙二醇、甘油、丙二醇、或其它溶剂;抗细菌剂;抗氧化剂;螯合剂;缓冲剂诸如乙酸盐、柠檬酸盐、或磷酸盐;以及用于调节渗透压的试剂,诸如氯化钠或葡萄糖。肠胃外制剂可以封装在安瓿、一次性注射器、或由玻璃或塑料制成的多剂量药瓶内。优选使用生理盐水,而且可注射的药物组合物优选是无菌的。
本文所述组合物可以配制成缓释的(即诸如在施用后实行缓慢释放化合物的胶囊或海绵体的配方)。通常可以使用众所周知的技术来制备这些组合物,并通过例如口服、直肠、或皮下植入或是通过期望靶部位的植入来进行施用。缓释配方可以包含散布在载体基质中和/或包含在由速率控制膜包围的储库中的试剂。用于这些配方的载体是生物相容的,而且可以是生物可降解的;优选的是,配方提供了相对恒定水平的活性成分释放。缓释配方中所包含的活性成分的量取决于植入部位、释放的速率和期望持续时间、以及待治疗或预防的状况的本质。在这个方面有用的例示性载体包括聚(丙交酯-共-乙交酯)、聚丙烯酸酯、胶乳(latex)、淀粉、纤维素、葡聚糖、诸如此类的微粒。其它例示性延迟释放载体包括包含非液体亲水核(例如交联多糖或寡糖)和可选地包含两亲化合物诸如磷脂的外层的超分子生物载体(参阅例如美国专利号5,151,254和PCT申请WO 94/20078、WO/94/23701、和WO 96/06638)。
在另一个例示性实施方案中,采用生物可降解微球体(例如聚乳酸聚乙醇酸酯)作为本发明组合物的载体。合适的生物可降解微球体公开于例如美国专利号4,897,268、5,075,109、5,928,647、5,811,128、5,820,883、5,853,763、5,814,344、5,407,609、和5,942,252。经修饰的乙型肝炎核心蛋白载体系统,诸如WO/9940934及其引用的参考文献中所述的那些,也可用于许多应用中。另一种例示性载体/投递系统采用包含微粒-蛋白质复合物的载体,诸如美国专利号5,928,647中所述的那些,它们能够在宿主中诱导I类限制性细胞毒性T淋巴细胞应答。
在另一个例示性实施方案中,采用磷酸钙核心颗粒作为本发明组合物的载体或受控释放基质。例示性磷酸钙颗粒公开于例如已发表专利申请号WO/0046147。
对于包含编码抗SOST抗体和/或调控剂的多核苷酸(从而原位生成该多肽和/或调控剂)的药物组合物而言,多核苷酸可以存在于本领域普通技术人员知道的多种投递系统中,包括核酸以及细菌、病毒、和哺乳动物表达系统。用于将DNA掺入这些表达系统的技术对于本领域普通技术人员而言是众所周知的。如下列文献中所述,DNA还可以是“裸露的”,例如Ulmer等,Science 2591745-1749,1993和综述Cohen,Science 2591691-1692,1993。可以通过将DNA包被在能够高效转运到细胞中的生物可降解珠上来增加裸露DNA的摄取。
在包括例如口服、肠胃外、静脉内、鼻内、和肌肉内施用和配方在内的多种治疗方案中使用本文所述特定组合物的合适剂量和治疗方案的发展在本领域是众所周知的,出于例示的一般性目的,下文将对其中一些作简要讨论。
在某些应用中,可以通过口服施用而对动物投递本文公开的药物组合物。如此,可以用惰性稀释剂或可同化的可食用载体配制这些组合物,或者可以将它们包裹在硬壳或软壳明胶胶囊中,或者可以将它们压缩成片剂,或者可以将它们直接掺入膳食食品中。
在某些情况中,通过肠胃外、静脉内、肌肉内、或甚至腹膜内途径投递本文公开的药物组合物将是合乎需要的。这些方法对于本领域技术人员而言是众所周知的,下列专利对其中一些有进一步描述,例如美国专利号5,543,158、5,641,515、和5,399,363。在某些实施方案中,可以在与表面活性剂诸如羟丙基纤维素适当混合的水中制备活性化合物作为游离基或制药学可接受盐的溶液。还可以在甘油、液体聚乙二醇、及其混合物和在油中制备分散体。在贮存和使用的常规条件下,这些制剂通常将包含防腐剂以预防微生物的生长。
适于注射用途的例示性制药学形式包括无菌水溶液或分散体以及用于临场制备无菌可注射溶液或分散体的无菌粉剂(例如参阅美国专利号5,466,468)。在所有情况中,该形式必须是无菌的,而且流动性必须达到易于注射的程度。它在制造和贮存条件下必须是稳定的,而且必须预防微生物诸如细菌和真菌的污染作用。载体可以是溶剂或分散介质,包含例如水、乙醇、多元醇(例如甘油、丙二醇、液体聚乙二醇、诸如此类)、及其合适混合物和/或植物油。例如可以通过使用涂层诸如卵磷脂、在分散体的情况中通过维持所需颗粒大小、和/或通过使用表面活性剂来维持适当的流动性。对微生物作用的预防通过多种抗细菌和抗真菌试剂变得容易,例如对羟基苯甲酸酯类、氯丁醇、酚、山梨酸、硫柳汞、诸如此类。在许多情况中,优选包含等渗剂,例如糖类或氯化钠。可以通过在组合物中使用延迟吸收的试剂例如单硬脂酸铝和明胶来实现可注射组合物的延迟吸收。
在一个实施方案中,对于水溶液的肠胃外施用,如果需要,溶液应当适当缓冲,并首先用足够的盐或葡萄糖使得液体稀释剂等渗。这些特定水溶液尤其适于静脉内、肌肉内、皮下、和腹膜内施用。在这方面,本领域技术人员根据本公开书将知道可以采用的无菌水性介质。例如,可以将一个剂量溶于1ml等渗NaCl溶液,或是添加到1000ml皮下输液中,或是注射到建议的输液部位(参阅例如《雷明顿氏制药科学》(Remington′s Pharmaceutical Sciences),第15版,第1035-1038页和第1570-1580页)。根据待治疗患者的状况,可能有必要对剂量进行一些改变。此外,对于人类施用,制剂当然优选达到FDA生物制剂标准办公室要求的无菌、热原性、以及一般安全性和纯度标准。
在本发明的另一个实施方案中,本文公开的组合物可以配制成中性或盐形式。例示性的制药学可接受盐包括(由蛋白质的游离氨基形成的)酸加成盐,以及用无机酸诸如例如盐酸或磷酸或者有机酸诸如乙酸、草酸、酒石酸、扁桃酸等形成的盐。由游离羧基形成的盐也可以衍生自无机碱,诸如例如钠、钾、铵、钙、或铁的氢氧化物,和有机碱,诸如异丙胺、三甲胺、组氨酸、葡鲁卡因等。配制后,将以与剂量形式相容的方式和诸如治疗上有效的量施用溶液。
载体还可以包含任何和所有溶剂、分散介质、媒介、涂层、稀释剂、抗细菌和抗真菌剂、等渗和吸收延迟剂、缓冲剂、载体溶液、悬浮液、胶体、诸如此类。这些介质和试剂对制药学活性物质的使用在本领域是众所周知的。除非任何常规介质或试剂与活性成分不相容,否则涵盖它在药物组合物中的使用。还可以将补充性活性成分掺入组合物中。术语“制药学可接受的”指在施用于人后不产生过敏或相似的不利反应的分子实体和组合物。
在某些实施方案中,使用脂质体、纳米胶囊、微粒、脂质颗粒、囊泡、诸如此类将本发明的组合物导入合适的宿主细胞/生物体。具体而言,可以将本发明的组合物包裹到脂质颗粒、脂质体、囊泡、纳米球体、或纳米颗粒等中,如此配制用于投递。或者,可以将本发明的组合物共价或非共价结合到这些载体媒介的表面上。
脂质体和脂质体样制剂作为潜在药物载体的形成和使用在本领域技术人员中通常是知道的(参阅例如Lasic,Trends Biotechnol.16(7)307-21,1998;Takakura,Nippon Rinsho 56(3)691-95,1998;Chandran等,Indian J.Exp.Biol.35(8)801-09,1997;Margalit,Crit.Rev.Ther.Drug Carrier Syst.12(2-3)233-61,1995;美国专利号5,567,434;美国专利号5,552,157;美国专利号5,565,213;美国专利号5,738,868;和美国专利号5,795,587,明确将每一篇完整收入本文作为参考)。
脂质体已经成功用于其它方法通常难以转染的多种细胞类型,包括T细胞悬浮液、原代肝细胞培养物和PC 12细胞(Renneisen等,J.Biol.chem.265(27)16337-42,1990;Muller等,DNA Cell Biol.9(3)221-29,1990)。另外,脂质体没有基于病毒的投递系统通常所具有的DNA长度限制。脂质体已经有效用于将基因、多种药物、放射性治疗剂、酶、病毒、转录因子、变构效应物、诸如此类导入多种培养细胞系和动物。此外,脂质体的使用似乎与全身投递后的自身免疫应答或不可接受的毒性无关。
在某些实施方案中,脂质体是由分散在水性介质中且自发形成多层同心双层囊泡(也称为多层囊泡(MLV))的磷脂形成的。
或者,在其它实施方案中,本发明提供了本发明组合物的制药学可接受的纳米胶囊配方。纳米胶囊通常能够以稳定且可再生的方式包裹化合物(参阅例如Quintanar-Guerrero等,Drug Dev.Ind.Pharm.24(12)1113-28,1998)。为了避免由于细胞内聚合物过载引起的副作用,可以使用能够在体内降解的聚合物来设计这些超细颗粒(大小为0.1μm左右)。可以如下列文献中所述制作这些颗粒,例如Couvreur等,Crit.Rev.Ther.Drug Carrier Syst.5(1)1-20,1988;zur Muhlen等,Eur.J.Pharm.Biopharm.45(2)149-55,1998;Zambaux等,J.Controlled Release 50(1-3)31-40,1998;和美国专利号5,145,684。
另外,本发明的药物组合物可以与包装材料一起置于容器中,后者提供了关于这些药物组合物的用法的说明书。一般而言,这些说明书将包括描述试剂浓度的确实表述,以及在某些实施方案中可能包括重建药物组合物所必需的赋形剂成分或稀释剂(例如水、盐水、或PBS)的相对量。
治疗方法本发明还提供了用于增加骨的矿物质含量和矿物质密度的方法。简而言之,众多状况导致骨矿物质含量流失,包括例如疾病、遗传素质、导致骨使用缺乏的事故(例如由于骨折)、影响骨再吸收或杀死骨形成细胞的治疗剂、和正常衰老。通过使用本文所述抑制TGF-β结合蛋白与TGF-β家族成员结合的分子,可以治疗或预防这些状况。在用于本文时,应当理解,若在选择的部位骨矿物质含量以统计学显著方式(例如大于标准偏差的一半)有所增加,则骨矿物质含量增加了。
可以用本文所述分子来治疗导致骨矿物质含量流失的非常多种状况。可以通过采用众所周知的技术(参阅例如《哈里森氏内科医学原理》(Harrison′s Principles of Internal Medicine),McGraw-Hill公司)的临床诊断来鉴定具有这些状况的患者。可以治疗的疾病的代表性实例包括其中骨的生长或发育异常的发育不良。这些状况的代表性实例包括软骨发育不全、颅骨锁骨发育不良、内生软骨瘤病、纤维性发育不良、戈谢病、低磷酸盐血症性佝偻病、马方综合症、多发性遗传性外生骨疣、神经纤维瘤病、成骨不全、骨硬化症、脆弱性骨硬化、硬化损伤、骨折、牙周病、假关节病、和化脓性骨髓炎。
可以治疗或预防的其它状况包括骨质减少(即引起骨矿物质含量或密度低于年轻时峰值骨骼矿物质含量超过1个标准偏差的状况)的非常多种原因。这些状况的代表性实例包括贫血状态、由类固醇引起的状况、由肝素引起的状况、骨髓疾病、坏血病、营养不良、缺钙、特发性骨质疏松、先天性骨质减少或骨质疏松、酒精中毒、慢性肝病、衰老、绝经后状态、月经过少、闭经、怀孕、糖尿病、甲状腺功能亢进、库欣病、肢端肥大病、性腺功能减退、制动术或废用、反射交感性营养不良综合症、暂时局部骨质疏松、和骨软化症。
在本发明的一个方面,可以通过对温血动物施用治疗有效量的抑制TGF-β结合蛋白与TGF-β家族成员结合的分子来增加骨矿物质含量或密度。可以治疗的温血动物的实例包括脊椎动物和哺乳动物二者,包括例如人、马、牛、猪、绵羊、狗、猫、大鼠、和小鼠。治疗性分子的代表性实例包括核酶、核酶基因、反义寡核苷酸、和抗体(例如人源化抗体或本文所述任何其它抗体)。
在本发明的其它方面,提供了用于增加骨密度的方法,包括下列步骤将指导抑制TGF-β结合蛋白与TGF-β家族成员结合的分子表达的载体导入归巢至骨的细胞,并将包含载体的细胞施用于温血动物。简而言之,可以直接由患者的骨(例如由骨髓获得的细胞,诸如CD34+、成骨细胞、骨细胞、诸如此类)、由外周血、或由培养物获得归巢至骨的细胞。
可以将指导抑制TGF-β结合蛋白与TGF-β家族成员结合的分子表达的载体导入细胞。合适载体的代表性实例包括病毒载体,诸如疱疹病毒载体(参阅美国专利号5,288,641)、腺病毒载体(例如WO94/26914、WO 93/9191;Kolls等,PNAS 91(1)215-219,1994;Kass-Eisler等,PNAS 90(24)11498-502,1993;Guzman等,Circulation88(6)2838-48,1993;Guzman等,Cir.Res.73(6)1202-1207,1993;Zabner等,Cell 75(2)207-216,1993;Li等,Hum.Gene Ther.4(4)403-409,1993;Caillaud等,Eur.J.Neurosci.5(10)1287-1291,1993;Vincen t等,Nat.Genet.5(2)130-134,1993;Jaffe等,Nat.Genet.1(5)372-378,1992;和Levrero等,Gene 101(2)195-202,1991)、腺伴随病毒载体(WO 95/13365;Flotte等,PNAS 90(22)10613-10617,1993)、杆状病毒载体、细小病毒载体(Koering等,Hum.Gene Therap.5457-463,1994)、痘病毒载体(Panicali和Paoletti,PNAS 794927-4931,1982;和Ozaki等,Biochem.Biophys.Res.Comm.193(2)653-660,1993)和逆转录病毒载体(例如EP 0,415,731、WO 90/07936、WO 91/0285、WO 94/03622、WO 93/25698、WO 93/25234、美国专利号5,219,740、WO 93/11230、和WO 93/10218)。同样可以构建包含来自不同病毒或非病毒来源的不同元件的混合物(例如启动子、包膜序列、诸如此类)的病毒载体。在多种实施方案中,可以在下文所述方法和组合物中采用或是病毒载体自身或是包含病毒载体的病毒颗粒。
在本发明的其它实施方案中,可以通过多种技术施用编码抑制TGF-β结合蛋白与TGF-β家族成员结合的分子的核酸分子自身,包括例如与聚L-赖氨酸DNA复合物缀合的脱唾液酸血清类粘蛋白(ASOR)的施用(Cristano等,PNAS 92122-92126,1993)、与杀死的腺病毒相连的DNA(Curiel等,Hum.Gene Ther.3(2)147-154,1992)、由细胞转染剂介导的导入(DMRIE-DOPE,Vical,加利福尼亚)、直接DNA注射(Acsadi等,Nature 352815-818,1991)、DNA配体(Wu等,J.Biol.Chem.26416985-16987,1989)、脂转染(Felgner等,Proc.Natl.Acad.Sci.USA 847413-7417,1989)、脂质体(Pickering等,Circ.89(1)13-21,1994;和Wang等,PNAS 847851-7855,1987);微弹轰击(Williams等,PNAS 882726-2730,1991)、和编码蛋白质的核酸分子自身单独的(Vile和Hart,CancerRes.533860-3864,1993)或采用PEG-核酸复合物的直接投递。可以由本发明载体表达的分子的代表性实例包括核酶和反义分子,上文对二者都有更为详细的讨论。
骨矿物质含量增加的确定可以使用X射线(例如双重能量X射线吸收谱学或“DEXA”)来直接测定,或是通过骨周转标志物(诸如成骨细胞特异性碱性磷酸酶、骨钙蛋白、1型前胶原C′前肽(PICP)、和总碱性磷酸酶;参阅Comier,C.,Curr.Opin.Rheu.7243,1995)或骨再吸收标志物(吡啶啉、脱氧吡啶啉、N-端肽、尿液羟脯氨酸、血浆抗酒石酸酸性磷酸酶、和半乳糖基羟赖氨酸;参阅Comier,见上文)来推断。还可以由体重计算骨质的数量,或是通过本领域知道的其它方法(参阅Guinness-Hey,Metab.Bone Dis.and Relat.Res.5177-181,1984)。
对于本领域技术人员而言显而易见的是,施用的数量和频率当然将取决于诸如正在治疗的适应证的本质和严重程度、期望的响应、患者的状况、等等因素。通常,可以通过如上所述多种技术来施用组合物。
提供下列实施例作为示例而绝非限制。
实施例实施例1硬化性骨化病作图到人第17号染色体长臂造成人硬化性骨化病的缺陷的遗传作图将造成此疾病的基因定位于人第17号染色体中编码新TGF-β结合蛋白家族成员的区域。在硬化性骨化病人群中,骨骼的矿物质密度相对于未患病人员而言展示出较大的增加。头部的骨同样呈现出生长过度。硬化性骨化病患者通常是健康的,尽管他们可能显示出出生时不同程度的并指(趾)现象和不同程度的头颅压迫以及头骨中的神经压迫。
与硬化性骨化病相关的基因缺陷的连锁分析通过对采集自有此病史的24个南非Afrikaaner家族的DNA样品进行纯合性作图来完成。(Sheffield等,1994,Human MolecularGenetics 31331-1335.“3号染色体上Bardet-Biedl综合症位点的鉴定以及有效同源性作图方法的评估(Identification of a Bardet-Biedl syndrome locus onchromosome 3 and evaluation of an efficient a pproach tohomozygosity mapping)”)。南非Afrikaaner人群从遗传上说是均一的;该人群是从几个世纪前殖民于此地区的少数建立者繁衍而来的,并且,自从建立以来他们已由于地理和社会屏障而被隔离。在Afrikaaner群落之外的世界各地,硬化性骨化病都是罕见的,这显示出该建立者群体中存在基因突变,且后来随着人口的增多,突变的数目也有所增加。纯合性作图的应用是以一定的假设为基础的,即在来自同血缘家族和隔离人群的受影响个体中邻近隐性突变的DNA作图标记很可能是纯合的。
选择来自常染色体的一组371个微型卫星标记(ResearchGenetics,Set 6)测定取自硬化性骨化病患者样品的DNA集合的类型。用于此项分析的DNA样品来自24个家庭的29名硬化性骨化病患者、59名未患病的家庭成员和同一种群的一组无关对照个体。所述集合由4-6个个体组成,他们或者是患病个体、来自血亲家族的患病个体、父母和未患病的兄弟姐妹,或者是无关的对照。在无关个体组和大部分患病个体或家庭成员组中,所述标记的分析显示各个标记有几种等位基因大小。标记之一,即D17S 1299呈现出纯合的迹象在数个患病个体集合中都是一条带。
用D17S1299区(在17q12-q21)的总共19个标记对所有24个硬化性骨化病家族进行了分型。来自每个家族的患病个体显示出在此区域是纯合的,而29个个体中有25个对于核心单倍体是纯合的;他们各自在D17S1787和D17S930之间具有相同的等位基因。其它四个个体具有匹配此单倍体的一条染色体和不匹配的另一条染色体。总而言之,这些数据有力的显示了此3 megabase区域包含了硬化性骨化病突变。对此3 megabase区域中大部分外显子的序列分析识定出了新TGF-β结合蛋白编码序列中的无义突变(在SEQ ID NO1的序列第117位C突变成T产生了终止密码子)。此突变显示出对于硬化性骨化病患者和Afrikaaner后代携带者而言是独特的。此基因的特性通过鉴定其内含子中的突变(内含子+3位置处A突变成T)得到进一步的证实,所述突变导致已确诊为硬化性骨化病的单个无关患者中mRNA加工不正确。
实施例2TGF-β结合蛋白基因表达的组织特异性A.利用RT-PCR进行人beer基因表达利用商品化的试剂盒(“用于第一条cDNA链合成的Superscript预扩增体系(Preamplification System for First-Strand cDNASynthesis)”,Life Technologies,Rockville,MD)从以下总RNA样品中制备第一链cDNA人脑、人肝、人脾、人的胸腺、人的胎盘、人的骨骼肌、人的甲状腺、人的垂体、人的成骨细胞(NHOst,来自Clonetics Corp.,San Diego,CA)、人骨肉瘤细胞系(Saos-2,ATCC#HTB-85)、人的硬骨、人的骨髓、人的软骨、长尾黑颚猴(vervet monkey)的骨骼、酿酒酵母和人外周血单核细胞。除了以下种类是自己制备的之外,所有的RNA样品均购买获得(Clontech,Palo Alto,CA)人的成骨细胞、人的骨肉瘤细胞系、人的硬骨、人的软骨和长尾黑颚猴的骨骼。这些自备的RNA样品是使用商品化的试剂盒(“TRI试剂”,Molecular Research Center,Inc.,Cincinnati,OH)制备。
对这些样品进行PCR,并另外用人基因组样品进行PCR作为对照。有义Beer寡核苷酸引物的序列为5’-CCGGAGCTGGAGAACAACAAG-3’(SEQ ID NO19)。反义Beer寡核苷酸引物的序列为5’-GCACTGGCCGGAGCACACC-3’(SEQ ID NO20)。此外,用针对人β-肌动蛋白基因的引物进行PCR作为对照。有义β-肌动蛋白寡核苷酸引物的序列为5’-AGGCCAACCGCGAGAAGATGA CC-3’(SEQ ID NO21)。反义β-肌动蛋白寡核苷酸引物的序列为5’-GAAGTCCAGGGCGACGTAGCA-3’(SEQ ID NO22)。用标准条件在25μl反应体系中进行PCR,退火温度为61℃。用Beer引物进行32个循环的PCR,而用β-肌动蛋白引物则进行24个循环。
扩增后,将来自各次反应的12μl样品通过琼脂糖凝胶电泳和溴化乙锭染色进行分析。参阅图2A。
B.小鼠胚胎切片的RNA原位杂交用制造商的方案,以反义和有义方向将全长小鼠Beer cDNA(Sequence ID No.11)克隆入pCR2.1载体(Invitrogen,Carlsbad,CA)中。用Ambion,Inc(Austin,TX)提供的体外转录试剂合成35S-α-GTP-标记的cRNA有义和反义转录产物。按照Lyons等的方案(J.CellBiol.1112427-2436,1990)进行原位杂交。
小鼠Beer cRNA探针检测正在发育的小鼠胚胎的神经管、肢芽、血管和硬化软骨中表达的特异信息。图3的模块A显示了肢(1)芽顶端外胚层脊背(apical ectodermal ridge,aer)、血管(bv)和神经管(nt)中的表达。模块B显示了大脑第4脑室(4)中的表达。模块C显示了下颚(ma)颈椎骨(cv)中、枕骨(oc)、上颚(pa)和血管(bv)中的表达。模块D显示了肋骨(r)和心脏瓣膜(va)中的表达。模块A是10.5dpc胚胎的横切片。模块B是12.5dpc胚胎的纵切片,而模块C和D是15.5dpc胚胎的纵切片。
ba=鳃弓,h=心脏,te=端脑(前脑),b=脑,f=额鼻块,g=肠,h=心脏,j=颚,li=肝,lu=肺,ot=耳泡(otic vesicle),ao=,sc=脊髓,skm=骨骼肌,ns=鼻窦,th=胸腺,to=舌,fl=前肢,di=横膈膜实施例3重组Beer蛋白质的表达和纯化A.在COS-1细胞中的表达用以下PCR寡核苷酸引物扩增编码全长人Beer蛋白的DNA序列5’寡核苷酸引物的序列为5’-AAGCTTGGTACCATGCAGCTCCCAC-3’(SEQ ID NO23),并且包含HindIII限制性酶切位点(粗体),之后是Beer基因的19个核苷酸,其在推测的氨基末端起始密码子(ATG)之前6bp开始。3’寡核苷酸引物的序列为5’-AAGCTTCTACTTGTCATCGTCGTCCTTGTAGTCGTAGGCGTTCTCCAGCT-3’(SEQ ID NO24),并包含HindIII限制性酶切位点(粗体),之后是反向互补终止密码子(CTA),其后是FLAG表位的反向互补序列(下划线,Sigma-Aldrich Co.,St.Louis,MO),该互补序列侧翼是Beer羧基末端5个氨基酸的编码核苷酸的反向互补序列。经TA克隆PCR产物(“原创的TA克隆试剂盒”,Invitrogen,Carlsbad,CA)并通过DNA测序筛选各个克隆。然后将序列已证实的克隆用HindIII消化,并用商品化的试剂(“QIAquick Gel Extraction Kit”,Qiagen Inc.,Valencia,CA)在1.5%琼脂糖凝胶上进行纯化。然后用T4DNA连接酶将此片段连接至经HindIII消化、磷酸酶处理的pcDNA3.1质粒(Invitrogen,Carlsbad,CA)上。转化大肠杆菌DH10B,并铺在含100μg/ml氨苄青霉素的LB平板上。通过基于PCR的筛选鉴定携带正确定向的预期重组子的菌落,所用5’引物相应于pcDNA 3.1中的T7启动子/启动位点,而3’引物具有序列5’-GCACTGGCCGGAGCACACC-3’(SEQ ID NO25),其相应于内在Beer序列的反向互补序列。已克隆片段的序列通过DNA测序证实。
利用COS-1细胞(ATCC#CRL-1650)进行转染。按制造商提供的方案,利用商品化的试剂盒(“DEAE-葡聚糖转染试剂盒”,SigmaChemical Co.,St.Louis,MO)转染50μg表达质粒pcDNA-Beer-Flag。转染后的最终培养基是含0.1%胎牛血清的DMEM(Life Technologies,Rockville,MD)。培养4天后,去掉培养基。利用抗-FLAG_M2单克隆抗体(Sigma-Aldrich Co.,St.Louis,MO)通过SDS-PAGE和Western印迹分析重组Beer的表达。用抗-FLAG M2亲和柱(“哺乳动物瞬时表达体系”,Sigma-Aldrich Co.,St.Louis,MO)进行重组BEER蛋白质的纯化。用抗-FLAG M2单克隆抗体通过SDS-PAGE和Western印迹分析枉层析产物。
B.在SF9昆虫细胞中的表达用标准条件和以下引物经PCR扩增人Beer基因序列有义引物5’-GTCGTCGGATCCATGGGGTGGCAGGCGTTCAAGAATGAT-3’(SEQ ID NO26)反义引物5’-GTCGTCAAGCTTCTACTTGTCATCGTCCTTGTAGTCGTAGGCGTTCTCCAGCTCGGC-3’(SEQ ID NO27)产生的cDNA包含具有两个修饰的Beer编码区。N末端分泌信号被去除,并将FLAG表位标签(Sigma)读框一致地融合入插入片段C-末端。添加BamH1和HindIII克隆位点,并将基因亚克隆入pMelBac载体(Invitrogen)中,以便用标准方法转移入杆状病毒表达载体中。
用Bac-N-Blue转染试剂盒(Invitrogen)制备表达Beer蛋白质的重组杆状病毒并按照制造商的说明书进行纯化。
将SF9细胞(Invitrogen)保持在含10%胎牛血清的TNM_FH培养基(Invitrogen)中。为了进行蛋白质表达,以大于10的MOI感染旋转烧瓶中的SF9培养物。5天内每天采集培养基和细胞样品,用抗-FLAGM2单克隆抗体(Sigma)或抗-Beer兔多克隆抗血清通过蛋白质印迹监测Beer的表达。
5天后,离心收获杆状病毒感染的SF9细胞,并用高盐抽提缓冲液(1.5M NaCl,50mM Tris pH7.5)从细胞沉淀中提取细胞相关蛋白质。离心使提取物(每300ml培养物20ml)澄清,用4升Tris缓冲盐(150mM NaCl,50mM Tris pH7.5)透析3次,并再次离心澄清。将此高盐组分加到Hitrap Heparin(Pharmacia;床体积5ml)上,柱子用HEPES缓冲盐水(25mM HEPES 7.5,150mM NaCl)粗洗,并用150mM NaCl至1200mM NaCl梯度洗脱被结合的蛋白质。在大约800mMNaCl处观察到Beer洗脱。在含Beer的组分中加入10%甘油和1mM DTT并冻存于-80℃。
实施例4抗Beer、Gremlin和Dan的多克隆抗体的制备和检测A.抗原的制备用标准方法扩增人Beer、人Gremlin和人Dan的DNA序列,所用的寡核苷酸引物如下H.Beer有义5′-GACTTGGATCCCAGGGGTGGCAGGCGTTC-3′(SEQ ID NO28)反义5′-AGCATAAGCTTCTAGTAGGCGTTCTCCAG-3′(SEQ ID NO29)H.Gremlin有义5′-GACTTGGATCCGAAGGGAAAAAGAAAGGG-3′(SEQ ID NO30)30)反义5′-AGCATAAGCTTTTAATCCAAATCGATGGA-3′(SEQ ID NO31)H.Dan有义5′-ACTACGAGCTCGGCCCCACCACCCATCAACAAG-3′(SEQ ID NO32)反义5′-ACTTAGAAGCTTTCAGTCCTCAGCCCCCTCTTCC-3′(SEQ ID NO33)在各情况下,所列举的引物扩增除了分泌信号序列之外的整个编码区。其中,对于Beer和Gfemlin而言,包含在位点BamHI/HindIII处、对于Dan而言包含在位点sacI/HindIII亚克隆入细菌表达载体pQE-30(Qiagen Inc.,Valencia,CA)的限制性切点。pQE30在克隆区的5’末端包含了6×His标签的编码序列。将完成的构建体转化入大肠杆菌菌株M-15/pRep(Qiagen Inc)并测序查证各个克隆。在M-15/pRep中的蛋白质表达和纯化(与偶联在琼脂糖上的Ni-NTA结合的6×组氨酸亲和标签)依照制造商的说明书(Qiagen,TheQIAexpressionist)进行。
利用增溶作用在6M胍中大量回收大肠杆菌来源的Beer蛋白质,并透析至2-4M胍中,以防止在贮存期间沉淀。Gremlin和Dan蛋白质则通过溶解于6M胍中得到更大量的回收,纯化后的胍浓度达到0.5M。
B.多克隆抗体的产生和检测按照标准方案(R & R抗体,Stanwood,WA;用于兔免疫和抗血清回收的标准方案(standard protocol for rabbit immunization andantisera recovery);分子生物学中的简洁方法(Short Protocolsin Molecular Biology).第二版1992.11.37-11.41,投稿人HelenM.Cooper和Yvonne Paterson;用重要的生物溶液产生鸡抗血清(chicken antisera was generated with Strategic Biosolutions),Ramona,CA)在兔子和鸡宿主中产生针对三种抗原中每一种的多克隆抗体。
通过Western印迹法筛选兔抗血清和鸡蛋Igy组分的活性。经PAGE分离三种抗原中的每一种并转染至0.45um的硝酸纤维素膜(Novex,San Diego,CA)上。将膜切成条,每条包含大约75ng抗原。将这些膜条用3%的Blotting Grade Block(Bio-Rad Laboratories,Hercules,CA)封闭并在1×Tris缓冲盐水(TBS)/0.02%TWEEN缓冲液中洗3次。将这些膜条与一抗(免疫前放血,将兔抗血清或鸡蛋IgY用封闭缓冲液稀释,稀释范围为1∶100至1∶10,000)一起温和摇动保温1小时。再用1×TBS/0.02%TWEEN洗三次,然后与二抗(缀合了驴抗兔抗体的过氧化物酶,Amersham Life Science,Piscataway,NJ;或缀合了驴抗鸡抗体的过氧化物酶,Jackson Immuno Research,WestGrove,PA)一起保温1小时。最后再用1×TBS/0.02%TWEEN洗三次,并将膜条用Lumi-Light Western印迹底物显色(Roche MolecularBiochemicals,Mannheim,Germany)。
C.抗体交叉反应性检测在完成以上章节所描述的流程之后,将Beer、Gremlin或Dan的硝酸纤维素膜条与它们各自的兔抗血清或鸡蛋IgY稀释液(1∶5000和1∶10,000)以及剩余两种抗原的抗血清或鸡蛋Igy(稀释1∶1000和1∶5000倍)一起保温。提高不匹配抗体的水平以检测只有在提高浓度下才可能被观察到的那些抗体的低亲和力结合。按照上述流程,所用方案和呈色时间对于所有三种结合情况而言都是相同的。对于任一种被检测抗原而言都未观察到抗原交叉反应性。
实施例5Beer与TGF-β超家族蛋白质的相互反应用免疫沉淀方法研究Beer与来自不同系统发生支的TGF-β超家族蛋白质的相互作用。已纯化的TGFβ-1、TGFβ-2、TGFβ-3、BMP-4、BMP-5、BMP-6和GDNF获自商品化途径(R&D systems;Minneapolis,MN)。代表性方案如下。将部分纯化的Beer在HEPES缓冲盐水(25mM HEPES 7.5,150mM NaCl)中透析。在300μl IP缓冲液(150mM NaCl,25mM TrispH7.5,1mM EDTA,1.4mM β-巯基乙醇,0.5% triton×100和10%甘油)中进行免疫沉淀。在存在或缺失500ng FLAG表位-标记Beer的条件下将30ng重组人BMP-5蛋白质(R&D systems)加到15μl FLAG亲和基质(Sigma;St Louis MO)中。将蛋白质在4℃保温4小时,并随后用IP缓冲液洗涤与亲和基质相联的蛋白质5次(每次1ml)。用60μl 1×SDS PAGE样品缓冲液从亲和基质上洗脱被结合的蛋白质。用SDS PAGE拆分蛋白质并用抗-BMP-5抗血清(Research Diagnostics,Inc)通过western印迹检测与Beer相连的BMP-5(见图5)。
BEER配体结合试验将FLAG-Beer蛋白质(20ng)加入100μl PBS/0.2%BSA中,并吸附于预先用抗FLAG单克隆抗体(Sigma;St Louis MO)包被并用含10%BSA的PBS封闭的96孔微量滴定板的各个孔中。这一过程在室温进行60分钟。除去此蛋白质溶液并漂洗各孔以去除未结合的蛋白质。在各孔中加入浓度范围从10pM至500nM的溶于PBS/0.2%BSA的BMP-5,并在室温保温2小时。去除结合溶液并用200μl体积的PBS/0.2%BSA漂洗平板三次。然后用BMP-5抗血清通过ELISA(F.M.Ausubel etal(1998)分子生物学通用方法(Current Protocols in Mol Biol.)卷211.2.1-11.2.22)检测BMP-5的水平。通过从总的结合中扣除非特异性结合来计算特异性结合,并用LIGAND软件(Munson和Podbard,Anal.Biochem.,107,p220-239,(1980)进行分析。
在此方法的修饰方案中,将Beer进行改造并表达为人Fc融合蛋白。同样的,改造配体BMP并将其表达为小鼠Fc融合蛋白。将这些蛋白质一起保温并如Mellor等所述用均一时间解析荧光检测法进行检测(G.W.Mellor等,J of Biomol Screening,3(2)91-99,1998)。
实施例6有关TGF-β结合蛋白与TGF-β家族成员结合的抑制作用的筛选试验重复上述试验,其中有两处不同。首先,BMP浓度固定为先前所确定的Kd。其次,拮抗剂候选物的集合以固定浓度加入(如果是小有机分子集合则为20μM,在抗体研究中则为1μM)。这些TGF-β结合蛋白结合的候选分子(拮抗剂)包括商品化来源的有机化合物或代表不同化学结构的内部合并物。用DMSO将这些化合物制备成贮液并在标准实验条件下以小于1%的终体积加入检测孔中。将它们与BMP和BEER一起室温保温2小时,去除溶液并如前所述对被结合的BMP进行定量。在缺乏化合物或抗体的条件下观察到抑制了40%的BMP结合的试剂被认为是此相互作用的拮抗剂。这些试剂基于滴定试验被进一步评估为潜在的抑制剂,所述的滴定试验用于测定它们的抑制作用常数以及它们对TGF-β结合蛋白结合亲和力的影响。还可进行可比较的特异性对照试验以确定已经鉴定的拮抗剂的选择性特征,该研究使用了依赖于BMP配体作用的检测法(例如,BMP/BMP受体竞争性试验)。
实施例7对TGF-β结合蛋白定位于骨基质的抑制作用对Nicolas的方法(Nicolas,V.Calcif Tissue Int 57206,1995)加以修改,用于评估对定位于骨基质(羟磷灰石)的抑制作用。简而言之,如Nicolas(同上文)所述制备125I-标记的TGF-β结合蛋白。将羟磷灰石加入装备了聚丙烯滤膜(Polyfiltroninc,Weymouth MA)的96孔微量滴定板的各孔中。将TGF-β结合蛋白加入含0.2%白蛋白的PBS缓冲液中。用此缓冲液将含有基质的孔漂洗3次。被吸附的TGF-β结合蛋白用0.3M NaOH洗脱并定量。
通过将TGF-β结合蛋白与待测分子一起保温并如上所述将混合物施加到基质上来进行抑制剂的鉴定。用含0.2%白蛋白的PBS缓冲液将基质洗3次。被吸附的TGF-β结合蛋白用0.3M NaOH洗脱并定量。在无化合物或抗体的条件下观察到抑制了40%TGF-β结合蛋白结合的试剂被认为是骨定位抑制剂。这些抑制剂通过剂量反应试验测定其抑制常数及其对TGF-B结合蛋白结合亲和力的影响而被进一步定性。
实施例8TGF-β结合蛋白突变体的构建A.诱变pBluescript SK中的全长TGF-β结合蛋白cDNA被用作诱变的模板。简而言之,利用适当的引物(参阅上文讨论部分)以及Vent DNA聚合酶(New England Biolabs,Beverly,MA)通过聚合酶链式反应产生DNA片段。在57℃退火温度下利用制造商提供的缓冲液进行聚合酶链式反应23个循环。然后将产物暴露于两种限制性酶中,并在用琼脂糖凝胶电泳进行分离后,连接回其中的匹配序列已通过酶促消化去除的pRBP4-503中。通过DNA测序检验突变体的完整性。
B.突变体TGF-β结合蛋白的哺乳动物细胞表达和分离将突变体TGF-β结合蛋白cDNAs转移入实施例3中所述的pcDNA3.1哺乳动物表达载体。在核实序列后,将产生的构建体转染入COS-1细胞,并如实施例3所述纯化分泌的蛋白质。
实施例9动物模型-I过表达BEER基因的转基因小鼠的产生利用分离自CITB小鼠基因组DNA文库(由Research Genetics,Huntsville,AL分装)的大约200kb BAC克隆15G5测定小鼠Beer基因的全序列及其5′和3′侧翼区。将包含完整基因体以及大约17kb的5′侧翼区和大约20kb的3′侧翼序列的41kb SalI片段亚克隆入SuperCosI粘粒载体(Stratagene,La Jolla,CA)的BamHI位点,并于大肠杆菌菌株DH10B中增殖。然后用常规方式分别凝胶纯化来自此粘粒构建体且包括完整小鼠Beer基因以及17kb和14kb的5′和3′侧翼序列的35kb MluI-AviII限制性片段(Sequence No.6),并将它用于小鼠受精卵的显微注射(DNX Transgenics;US Patent No.4,873,191)。以存活后代中有5-30%的频率获得其中所克隆的DNA片段随机整合入基因组中的建立者动物。通过对提取自诸如尾端等小量小鼠组织的基因组DNA进行Southern印迹分析来确定转基因的存在。用以下方案提取DNA在55℃用含200mM NaCl,100mM Tris pH8.5,5mM EDTA,0.2%SDS和0.5mg/ml蛋白酶K的裂解缓冲液消化组织过夜。次日,将DNA用酚/氯仿(50∶50)抽提一次,用氯仿/异戊醇(24∶1)抽提一次并用酒精沉淀。将各DNA样品8-10μg重悬于TE(10mM TrispH7.5,1mM EDTA)中,用诸如EcoRI等限制性内切酶消化,进行凝胶电泳并转移至诸如HyBondN+(Amersham,Arlington Heights,IL)等带电荷的尼龙膜上。然后将所产生的滤膜与来自小鼠Beer基因座的DNA的放射性标记片段杂交,所述片段能识别来自内源基因座的片段和来自转基因的不同大小的片段二者。将建立者动物与正常非转基因小鼠交配产生足够数目的转基因和非转基因后代,在其中测定Beer基因过表达的效应。为了进行这些试验,用各个年龄(例如,1天、3周、6周、4个月)的动物进行许多不同的试验,所述试验被设计成探知总的骨骼形成、骨矿物质密度、骨矿物质含量、破骨细胞和成骨细胞的活性、软骨内骨化的程度、软骨形成等。转基因的转录活性可通过从各种组织中提取RNA并借助RT-PCR检测法进行测定,该RT-PCR检测法利用了转基因所来源的小鼠株系(129Sv/J)和用于DNA显微注射的小鼠株系[(C57BL5/J×SJL/J)F2]之间单核苷酸多态性的优势。
动物模型-II通过同源重组破坏小鼠Beer基因可用胚胎干(ES)细胞同源重组灭活内源小鼠Beer基因并随后产生具有功能丧失的突变的动物。将诸如大肠杆菌β-半乳糖苷酶基因等报道基因插入打靶载体中,从而使其表达受内源Beer基因启动子和翻译起始信号的调控。以此方式,可以测定携带目标等位基因的动物中Beer基因表达的空间和时间模式。
打靶载体的构建首先是将来自pGT-N29(New England Biolabs,Beverly,MA)的药物可筛选的由磷酸甘油酸激酶(PGK)启动子驱动的新霉素抗性基因(neo)盒克隆入克隆载体pSP72(Promega,Madson,WI)中。利用PCR使PGKneo盒的两侧具有噬菌体P1 loxP位点,它是P1 Cre重组酶的识别位点(Hoess et al.,PNAS USA,793398,1982)。这使得后来可以去除打靶ES细胞或ES细胞来源动物中的neo-抗性标记(US Patent 4,959,317)。PCR引物包含34个核苷酸(ntd)的loxP序列、与PGKneo盒5′和3′末端互补的15-25 ntd以及用于克隆入pSP72的限制性酶识别位点(在有义引物中是BamHI,而在反义引物中是EcoRI)。有义引物是5′-AATCTGGATCCATAACTTCGTATAGCATACATTATACGAAGTTATCTGCAG GATTCGAGGGCCCCT-3′(SEQ ID NO34);反义引物是5′-AATCTGAATTCCACCGGTGTTAATTAAATAACTTCGTATAATGTATGCTATACGA AGTTATAGATCTAGAG TCAGCTTCTGA-3′(SEQ ID NO35)。
下一步是将含有大肠杆菌β-半乳糖苷酶基因和来自pSVβ(Clontech,Palo Alto,CA)的SV40聚腺苷酸化信号的3.6kbXhoI-HindIII片段克隆入pSP72-PGKneo质粒。通过由BAC克隆15G5扩增2.4kb片段得到来自小鼠Beer基因座的同源物的“短臂”。该片段的3′末端与Beer基因的翻译起始位点一致,且PCR中所用的反义引物还包括与β-半乳糖苷酶基因5’末端互补的30ntd,从而使其编码区能与Beer起始位点读框一致地融合。将“短臂”引入pSP72-βgal-PGKneo质粒所采用的方法是在β-gal基因上游的位点线性化质粒,然后将此片段与“短臂”PCR产物一起共转化,并选择其中PCR产物通过同源重组被整合了的质粒。用于“短臂”扩增的有义引物包括与pSP72载体互补的30ntd,从而使得此重组得以进行。有义引物的序列是5′-ATTTAGGTGACACTATAGAACTCGAGCAGCTGAAGCTTAAC CACATGGTGGCTCACAACCAT-3′(SEQ ID NO36),而反义引物的序列是5′-AACGACGGCCAGTGAATCCGTAATCATGGTCATGCTGCCAGGTGGAGGAGGGCA-3′(SEQ ID NO37)。
通过由BAC克隆15G5扩增6.1kb片段而得到Beer基因座的“长臂”,所用引物中还引入了切点稀有的限制性酶位点SgrAI、FseI、AscI和PacI。具体而言,有义引物的序列是5′-ATTACCACCGGTGACACCCGCTTCCTGACAG-3′(SEQ ID NO38);反义引物的序列是5′-ATTACTTAATTAAACATGGCGCGCCATATGGCCGGCCCCTAATTGCGGCGCATCGTTAATT-3′(SEQ ID NO39)。将所产生的PCR产物克隆入TA载体(Invitrogen,Carlsbad,CA)中作为中间产物。
小鼠Beer基因打靶构建体还包括第二个可选择标记,即在劳氏肉瘤病毒长末端重复元件(RSV LTR)调控下的单纯疱疹病毒胸苷激酶基因(HSVTK)。此基因的表达使得哺乳动物细胞对gancyclovir敏感(且不能生存);因此它是用于对抗选择其中所述构建体通过非重组活动发生整合的新霉素抗性细胞的便利方法(美国专利5,464,764)。使用使其随后可克隆入“长臂”-TA载体质粒的FseI和AscI位点内的引物,自pPS1337扩增RSVLTR-HSVTK盒。对于此PCR而言,有义引物的序列是5′-ATTACGGCCGGCCGCAAA GGAATTCAAGA TCTGA-3′(SEQ ID NO40);反义引物的序列是5′-ATTACGGCGCGCCCCTCACAGGCCGCACCCAGCT-3′(SEQ ID NO41)。
打靶载体构建中的最后步骤包括将含“长臂”和RSVLTR-HSVTK基因的8.8kb SgrAI-AscI片段克隆入pSP72-“短臂”-βgal-PGKneo质粒的SgrAI和AscI位点。在电穿孔进入ES细胞之前用AscI或PacI消化将此打靶载体线性化。
实施例10反义链介导的Beer失活以重叠格式制备17-个核苷酸的反义寡核苷酸,以此方式,第一寡核苷酸的5′末端与Beer转录物的翻译起始AUG重叠,接连着的寡核苷酸的5’末端相对于Beer AUG而言沿5’方向滚动增加的5个核苷酸处(最多在离其50个核苷酸处)。设计并制备对应的对照寡核苷酸,所用的碱基组成相当,但在序列中重新分布以抑制其与编码mRNA的任何显著杂交。通过阳离子脂质投递而将试剂投递至待测细胞体系(P.L.Felgner,Proc.Natl.Acad.Sci.USA 847413,1987)。将2μg反义寡核苷酸加入100μl简化血清培养基(Opti-MEMI简化血清培养基,Life Technologies,Gaithersburg MD)中,并在100μl简化血清培养基中与Lipofectin试剂(6μl)(Life Technologies,Gaithersburg MD)混合。将这些试剂混合后,在室温络合30分钟,并将混合物加入预先接种的MC3T3E21或KS483细胞中。培养这些细胞并回收mRNA。利用RT-PCR并结合Beer特异引物监测Beer mRNA。此外,收集分开的实验孔并如实施例4所述通过western印迹法鉴定蛋白质水平。收获细胞后,重悬于裂解缓冲液(50mM Tris pH7.5,20mM NaCl,1mM EDTA,1%SDS)中并收集可溶性蛋白。将此材料加至10-20%梯度变性SDS PAGE中。将被分开的蛋白质转移至硝酸纤维素滤膜上,并利用如上所述的抗体试剂进行western印迹分析。平行地,将对照寡核苷酸加入相同的培养物中并重复实验操作。如果与对照混合的寡核苷酸相比,在各情况下用反义寡核苷酸处理导致50%的改变,则BeermRNA或蛋白质水平的降低被认为是显著的。此方法能使得选择性失活基因并随后对组织培养模型中的矿物化结节进行表型表征。
实施例11硬化素核心区的模型模拟同源性识别技术(例如,PSI-BLAST(Altschul等,Nucleic AcidsRes.253389-402(1997))、FUGUE(Shi等,J.Mol.Biol.310243-57(2001))暗示SOST(SOST_Core)的核心区采取了胱氨酸结折叠的形式。FUGUE是检测序列与结构之间同源性的灵敏方法。实验测定的3D结构已知的人绒毛膜促性腺激素β(hCG-β)通过FUGUE(Shi等,同上)被确定为SOST_Core最接近的同源物。因此,hCG-β被用作结构模板来构建SOST_Core的3D模型。
SOST_Core与其密切同源物的序列比对如图7中所示。在序列比对所显示的同源物中,只有hCG-β(CGHB)具有已知的3D结构。SOST_Core和hCG-β之间的序列同一性大约为25%。在整个家族中有8个CYS残基是保守的,加强了SOST_Core和hCG-β之间整体结构的相似性。在“结”构型中三对胱氨酸(1-5,3-7,4-8)形成二硫键(在图7中以实心线表示),它是胱氨酸-结折叠的特征。在图7中显示为虚线的一个额外二硫键(2-6)对于此家族而言是独特的,将此家族蛋白质与其它胱氨酸-结家族蛋白质(例如,TGF-β,BMP)区别开来。
用PDB(Berman等,Acta Crystallogr.D.Biol..Crystallogr.58(Pt 6 Pt1)899-907(2002))登录号1HCN,以hCG-β的3D结构(Wuet al.,Structure 2545-58(1994))作为结构模板模拟SOST_Core。用MODELER(Sali & Blundell,J.Mol.Biol.234779-815(1993))对模型进行计算。最佳模型的快照如图8中所示。
大部分胱氨酸-结蛋白质形成二聚体,因为在单体中缺乏疏水核心(Scheufler等,同上;Schlunegger和Grutter,J.Mol.Biol.231445-58(1993));Wu等,同上)。SOST很可能遵循相似的规则并形成均二聚体以提高其稳定性。构建二聚体化SOST_Core区的模型有几个难题,因为(1)SOST_Core和hCG-β之间的序列相似性较低(25%);(2)hCG-β不形成均二聚体,而是与hCG-α形成杂二聚体;且(3)在来自不同家族的二聚体化胱氨酸-结蛋白质中观察到许多相对构象不同的单体(例如,PDGF,TGF-β,神经营养蛋白,IL-17F,促性腺激素),这表明SOST的二聚体构象可能明显与hCG-α/β杂二聚体构象不同。在构建模型时,用结构叠加技术与手工调整相结合,将hCG-α置换为来自杂二聚体结构(1HCN)的hCG-β,然后按照假hCG-β均二聚体结构建立SOST_Core均二聚体。最后的模型如图9中所示。
实施例12模拟SOST-BMP相互作用此实施例描述了BMP上I型和II型受体的蛋白质模拟,其中涉及BMP和SOST之间的相互作用。
竞争性研究证实了SOST与I型和II型受体竞争性结合BMP。在基于ELISA的竞争性试验中,BMP-6与硬化素-包被的表面(300ng/孔)以高亲和力(KD=3.4nM)选择性地相互作用。提高量的BMP受体IA(FC融合构建体)可与硬化素竞争结合BMP-6(11nM)(IC50=114nM)。10倍摩尔浓度过量的BMP受体足以使硬化素与BMP-6的结合减少大约50%。用BMP受体II-FC融合蛋白(IC50=36nM)和DAN(IC50=43nM)也观察到此竞争作用。该检测法的特异性表现为在硬化素和rActivinR1B-FC融合蛋白之间缺乏与BMP-6结合的竞争作用,所述的rActivinR1B-FC融合蛋白是不结合BMP的TGF-β受体家族成员。
BMP多肽上的I型和II型受体结合位点已被作图,并且在空间上是分离的(Scheufler等,同上文;Innis等,同上文;Nickel等,同上文;Hart等,同上文)。头蛋白是以高亲和力与BMP结合的另一种BMP拮抗剂,它通过头蛋白的N末端部分在I型和II型受体结合位点处都与BMP接触(Groppe等,同上文)。在接近C末端的核心区内的两条β-链也在II型受体结合位点处接触BMP。
手工调校的头蛋白和SOST的序列比对显示这两种多肽在蛋白质N末端部分之间和核心区之间共有序列相似性。氨基酸序列比对如图10中所示。形成特征性cys-结的半胱氨酸残基在头蛋白和SOST之间是保守的。总体序列同一性是24%,而N末端结合区(序列比对位置1-45)内的序列同一性是33%。在头蛋白N-末端结合区内的两个残基,即在序列比对中第21位的Leu(L)和第23位的Glu(E),据报道在BMP结合中起重要作用(Groppe等,同上文)。这两个残基在SOST中也是保守的。核心区(序列比对的第131-228位)内的序列相似性大约为20%,但cys-结骨架被保持,且足够数目的关键残基是保守的,这证实了头蛋白和SOST之间的同源性。
此外还将头蛋白结构与SOST比较以了解两个SOST单体是如何二聚体化的。正如图11中所示的,头蛋白结构暗示N末端区和核心区之间的接头不仅在连接这两个区域之间起作用,还形成了两头蛋白单体之间二聚化界面的部分。头蛋白和SOST之间的一个主要差异是N末端区和核心区之间的接头在SOST中要低得多。
SOST的C末端区可能在SOST二聚化的过程中发挥作用。头蛋白的序列结束于核心区,而SOST则有一额外的C末端区。在头蛋白结构中,两个头蛋白单体的C末端以二硫键连接。因而,SOST的C末端区开始向两个单体的界面靠近,并且可能有助于二聚化。此外,二级结构预测显示SOSR C末端区的某些部分有形成螺旋的趋势。SOST中的该区域可能负责二聚化活性,有可能是通过螺旋-螺旋堆积实现的,这模拟了头蛋白中较长接头的功能。头蛋白和SOST结构之间的另一差异是在SOST核心区内序列比对的第169-185位的氨基酸插入序列(见图10)。此插入延长了β-发夹,它指向头蛋白结构中的二聚化界面(在图11中显示为在单体中间且在C末端半胱氨酸残基上方的环形区)。此延长的β-发夹还可能有助于SOST二聚化。
实施例13SOST肽免疫原的设计和制备此实施例描述了SOST肽免疫原的有关设计,所述免疫原用于免疫动物并产生阻断BMP和SOST之间相互作用以及阻止SOST单体形成二聚体的抗体。
BMP结合片段SOST和头蛋白之间的总体相似性以及这两种多肽在N末端区之间的相似性显示SOST可能以类似头蛋白的方式与BMP相互作用。即,SOST的N末端区可能与BMP上I型和II型受体结合位点都相互作用,而核心区的部分(图10中氨基酸序列比对的第190-220位)可能与II型受体结合位点相互作用,从而使得特异于这些SOST区的抗体可能阻断或削弱BMP对SOST的结合。
大鼠和人SOST的这些SOST多肽片段的氨基酸序列提供如下。
SOST_N_接头N末端区(包括与核心区连接的短接头)人QGWQAFKNDATEIIPELGEYPEPPPELENNKTMNRAENGGRPPHHPFETKDVSEYS(SEQ ID NO92)大鼠QGWQAFKNDATEIIPGLREYPEPPQELENNQTMNRAENGGRPPHHPYDTKDVSEYS(SEQ ID NO93)SOST_核心_结合可能在其II型受体结合位点处接触BMP的核心区部分(在两个末端处都稍有延长以包含CYS残基锚)人CIPDRYRAQRVQLLCPGGEAPRARKVRLVASC(SEQ ID NO94)大鼠CIPDRYRAQRVQLLCPGGAAPRSRKVRLVASC(SEQ ID NO95)
SOST二聚化片段SOST的C末端区域有可能涉及SOST均二聚体的形成(见实施例12)。延长的β-发夹也可能在均二聚体的形成中发挥作用。特异性地结合这些区域的抗体可阻止或削弱SOST单体的二聚化,这可能反过来干扰SOST和BMP之间的相互作用。在大鼠和人SOST中相应于这些区域的多肽片段如下。
SOST_CC末端区域人LTRFHNQSELKDFGTEAARPQKGRKPRPRARSAKANQAELENAY(SEQ ID NO96)大鼠LTRFHNQSELKDFGPETARPQKGRKPRPRARGAKANQAELENAY(SEQ ID NO97)SOST_核心_二聚体SOST二聚化中可能涉及的核心区部分(在两个末端处都稍有延长以包含CYS残基锚)人CGPARLLPNAIGRGKWWRPSGPDFRC(SEQ ID NO98)大鼠CGPARLLPNAIGRVKWWRPNGPDFRC(SEQ ID NO99)SOST N-末端的BMP结合片段以头蛋白/BMP-7复合物结构(蛋白质数据库录入号1M4U)和氨基酸序列比对(见图10)为基础模拟关键的SOSTN末端结合区(图10中序列比对的第1-35位)以鉴定有可能与BMP相互作用的SOST N末端氨基酸残基。SOST模型如图12中所示。在比较模型中,SOST序列中序列比对第8位(见箭头所指和附属的文字说明)处的苯丙氨酸(Phe,F)伸入BMP二聚体表面上的疏水性口袋内。在BMP和I型受体复合物结构中观察到同样的“结入孔”特征(Nickel等,同上文),其中受体的Phe85嵌入同一口袋中,这是针对TGF-β超家族成员的配体-I型受体识别中的关键特征(包括例如TGF-β家族、BMP家族,等等)。依照该模型,脯氨酸(Pro)介导的转角也是保守的,它使N末端结合片段沿BMP二聚体表面延伸,从I型受体结合位点运动至复合物另一侧的II型受体结合位点。接近结合片段羧基末端的另一Pro介导的转角也是保守的,它与接头区连接。在图12中可明显显示了SOST和BMP之间的广泛接触。
肽免疫原将肽设计成包含预计与BMP蛋白质相接触的SOST N-末端区。肽序列如下所示。为了免疫动物,将肽序列设计成交迭的,并将一额外的半胱氨酸加至C末端以便于与KLH交联。然后将所述肽用于免疫动物。免疫原的肽序列如下。
人SOSTQGWQAFKNDATEIIPELGEY(SEQ ID NO47)TEIIPELGEYPEPPPELENN(SEQ ID NO48)PEPPPELENNKTMNRAENGG(SEQ ID NO49)KTMNRAENGGRPPHHPFETK(SEQ ID NO50)RPPHHPFETKDVSEYS(SEQ ID NO51)具有额外半胱氨酸的人SOST肽QGWQAFKNDATEIIPELGEY-C(SEQ ID NO52)TEIIPELGEYPEPPPELENN-C(SEQ ID NO53)PEPPPELENNKTMNRAENGG-C(SEQ ID NO54)KTMNRAENGGRPPHHPFETK-C(SEQ ID NO55)RPPHHPFETKDVSEYS-C(SEQ ID NO56)大鼠SOSTQGWQAFKNDATEIIPGLREYPEPP(SEQ ID NO57)pEPPQELENNQTMNRAENGG(SEQ ID NO58)ENGGRPPHHPYDTKDVSEYS(SEQ ID NO59)TEIIPGLREYPEPPQELENN(SEQ ID NO60)具有额外半胱氨酸的大鼠SOST肽
QGWQAFKNDATEIIPGLREYPEPP-C(SEQ ID NO61)PEPPQELENNQTMNRAENGG-C(SEQ ID NO62)ENGGRPPHHPYDTKDVSEYS-C(SEQ ID NO63)TEIIPGLREYPEPPQELENN-C(SEQ ID NO64)以下肽被设计成包含预计与BMP蛋白质接触的核心区部分的氨基酸。将半胱氨酸加到各肽的C末端以便与KLH连接,并将连接后的肽用于免疫动物。在停泊性核心N末端肽中,内部的半胱氨酸被改变成丝氨酸以避免与KLH的双重连接。
针对人SOST未添加半胱氨酸残基的氨基酸序列停泊_核心_N-末端_肽IPDRYRAQRVQLLCPGGEAP(SEQ ID NO66)停泊_核心_C末端_肽QLLCPGGEAPRARKVRLVAS(SEQ ID NO67)停泊_核心_N-末端_肽IPDRYRAQRVQLLCPGGEAP-C(SEQ IDNO68)停泊_核心_C末端_肽QLLCPGGEAPRARKVRLVAS-C(SEQ ID NO69)针对大鼠SOST无半胱氨酸残基添加或取代的氨基酸序列停泊_核心_N-末端_肽IPDRYRAQRVQLLSPGG(SEQ ID NO70)停泊_核心_C末端_肽PGGAAPRSRKVRLVAS(SEQ ID NO71)有半胱氨酸加入和取代的肽免疫原停泊_核心_N-末端_肽IPDRYRAQRVQLLSPGG-C(SEQ ID NO72)停泊_核心_C末端_肽PGGAAPRSRKVRLVAS-C(SEQ ID NO73)SOST内有可能相互作用而形成SOST均二聚体的两个区域包括头蛋白中不存在的SOST核心区域的氨基酸。被设计成包含此序列的人SOST肽具有与KLH缀合的C末端或N末端半胱氨酸。对于大鼠SOST肽而言,将一半胱氨酸加到序列(SEQ ID NO76)的羧基末端。用与KLH缀合的肽免疫动物。
对于人SOST
CGPARLLPNAIGRGKWWRPS(SEQ ID NO74)IGRGKWWRPSGPDFRC(SEQ ID NO75)对于大鼠SOSTPNAIGRVKWWRPNGPDFR(SEQ ID NO76)添加了半胱氨酸的大鼠SOST肽PNAIGRVKWWRPNGPDFR-C(SEQ ID NO77)SOST内有可能相互作用而形成SOST均二聚体的第二个区域包括C末端区。将肽免疫原设计成包括此区域内的氨基酸序列(见下文)。为了与KLH缀合,将一半胱氨酸残基加至C末端,并用缀合后的肽免疫动物。
适于人SOSTKRLTRFHNQS ELKDFGTEAA(SEQ ID NO78)ELKDFGTEAA RPQKGRKPRP(SEQ ID NO79)RPQKGRKPRP RARSAKANQA(SEQ ID NO80)RARSAKANQA ELENAY(SEQ ID NO81)在C末端添加了半胱氨酸的肽免疫原KRLTRFHNQS ELKDFGTEAA-C(SEQ ID NO82)ELKDFGTEAA RPQKGRKPRP-C(SEQ ID NO83)RPQKGRKPRP RARSAKANQA-C(SEQ ID NO84)RARSAKANQA ELENAY-C(SEQ ID NO85)对于大鼠SOSTKRLTRFHNQSELKDFGPETARPQ(SEQ ID NO86)KGRKPRPRARGAKANQAELENAY(SEQ ID NO87)SELKDFGPETARPQKGRKPRPRAR(SEQ ID NO88)
在C末端添加了半胱氨酸的肽免疫原KRLTRFHNQSELKDFGPETARPQ-C(SEQ ID NO89)KGRKPRPRARGAKANQAELENAY-C(SEQ ID NO90)SELKDFGPETARPQKGRKPRPRAR-C(SEQ ID NO91)实施例14检测抗体与TGF-β结合蛋白的结合的检测法此实施例描述了用于检测例如抗体或抗体片段等配体与硬化素的结合的检测法。
依照制造商(Sigma Aldrich,St.Louis,MO)的方案并如美国专利6,395,511中所述制备FLAG_-硬化素融合蛋白。用抗FLAG_-单克隆抗体(Sigma Aldrich)包被96孔微量滴定板的各孔,然后用溶于PBS的10%BSA封闭。将融合蛋白(20ng)加入100μl PBS/0.2%BSA中并在室温吸附于96孔板上60分钟。去除此蛋白质溶液,并漂洗各孔,以去除未结合的融合蛋白质。将诸如BMP-4、BMP-5、BMP-6或BMP-7等BMP稀释于PBS/0.2%BSA中,并以10pM至500nM范围的浓度加入各孔中。室温保温2小时后,去除结合溶液,并用200μl体积的PBS/0.2%BSA漂洗平板三次。依照标准ELISA技术用特异于BMP的多克隆抗血清或单克隆抗体以及适当酶缀合的第二步试剂检测BMP与硬化素的结合(参阅,例如,Ausubel等,分子生物学通用方法(CurrentProtocols in Mol Biol.)Vol 2 11.2.1-11.2.22(1998))。通过从总结合量中扣除非特异性结合来计算特异性结合并用LIGAND软件进行分析(Munson和Podbard,Anal.Biochem.107220-39(1980))。
此外还用均一时间解析荧光检测法探测硬化素与BMP的结合(Mellor等,J Biomol.Screening,391-99(1998))。依照本领域已知及本文所述方法将编码硬化素的多核苷酸序列与重组核酸构建体中的人免疫球蛋白恒定区有效连接,并表达为人Fc-硬化素融合蛋白。同样的,改造BMP配体并表达为BMP-小鼠Fc融合蛋白。将这两个融合蛋白一起保温并如Mellor等所述进行检测。
实施例15针对抑制TGF-β家族成员与TGF-β结合蛋白相结合的抗体的筛选试验此实施例描述了用于检测抑制TGF-β家族成员与硬化素相结合的抗体的方法。基本上如实施例14中所述进行ELISA,不同之处在于BMP浓度固定为其Kd值(例如,通过BIAcore分析测定)。此外,将抗体或抗体文库或集合以1μM的浓度加入孔中。将抗体与BMP和硬化素在室温保温2小时,去除溶液,如上文所述对结合的BMP进行定量(参阅实施例14)。抑制无抗体存在情况下所观察到的BMP结合达40%的抗体被认为是此相互作用的拮抗物。通过进行滴定试验测定其抑制常数以及它们对TGF-B结合蛋白结合亲和力的作用,将这些抗体作为潜在的抑制剂进一步评估。还可用依赖于BMP配体作用的检测法(例如,BMP/BMP受体竞争性试验)进行可比较的特异性对照试验,以确定已鉴定的拮抗物的选择性曲线。
实施例16对TGF-β结合蛋白定位于骨基质的抑制利用Nicolas(Calcif.Tissue Int.57206-12(1995))方法的修改版本进行骨基质定位的抑制作用的评估。简而言之,如Nicolas(同上文)所述制备125I-标记的TGF-β结合蛋白。将羟磷灰石加入配备了聚丙烯滤膜(Polyfiltroninc,Weymouth MA)的96孔微量滴定板的各孔中。将TGF-β结合蛋白稀释于含0.2%白蛋白的PBS缓冲液中并随后加入孔中。用含0.2%白蛋白的PBS缓冲液漂洗包含基质的孔三次。用0.3M NaOH洗脱被吸附的TGF-β结合蛋白并随后进行定量。
通过将TGF-β结合蛋白与抗体一起保温并如上所述将此混合物施加到基质中来鉴定抑制或削弱硬化素TGF-β结合蛋白与羟磷灰石结合的抗体。将所述基质用含0.2%白蛋白的PBS缓冲液洗3次。用0.3M NaOH洗脱被吸附的硬化素并随后进行定量。与无抗体存在条件下观察到的结合水平相比,对硬化素与羟磷灰石的结合水平至少抑制40%的抗体被认为是骨定位的抑制剂。在剂量反应试验中对这种抗体进一步定性,以测定其抑制常数和它对TGF-B结合蛋白结合亲和力的影响。
综上所述,尽管为了便于说明的目的在此描述了本发明的特殊实施方案,但是可以对它们进行各种修改而并不偏离本发明的精神和范围。因此,本发明并不只局限于所附的权利要求。
序列表<110>Brunkow,Mary E.
Galas,David J.
Kovacevich,BrianMulligan,John T.
Paaper,Bryan W.
Van Ness,JeffreyWinkler,David G.
<120>用于增加骨矿化的组合物和方法<130>60117-136<140>
<141>2004-06-15<150>US 10/463,190<151>2003-06-16<160>143<170>FastSEQ for Windows Version 3.0<210>1<211>2301<212>DNA<213>Homo sapien<400>1agagcctgtg ctactggaag gtggcgtgcc ctcctctggc tggtaccatg cagctcccac60tggccctgtg tctcgtctgc ctgctggtac acacagcctt ccgtgtagtg gagggccagg120ggtggcaggc gttcaagaat gatgccacgg aaatcatccc cgagctcgga gagtaccccg180agcctccacc ggagctggag aacaacaaga ccatgaaccg ggcggagaac ggagggcggc240ctccccacca cccctttgag accaaagacg tgtccgagta cagctgccgc gagctgcact300tcacccgcta cgtgaccgat gggccgtgcc gcagcgccaa gccggtcacc gagctggtgt360gctccggcca gtgcggcccg gcgcgcctgc tgcccaacgc catcggccgc ggcaagtggt420ggcgacctag tgggcccgac ttccgctgca tccccgaccg ctaccgcgcg cagcgcgtgc480agctgctgtg tcccggtggt gaggcgccgc gcgcgcgcaa ggtgcgcctg gtggcctcgt540gcaagtgcaa gcgcctcacc cgcttccaca accagtcgga gctcaaggac ttcgggaccg600aggccgctcg gccgcagaag ggccggaagc cgcggccccg cgcccggagc gccaaagcca660accaggccga gctggagaac gcctactaga gcccgcccgc gcccctcccc accggcgggc720gccccggccc tgaacccgcg ccccacattt ctgtcctctg cgcgtggttt gattgtttat780atttcattgt aaatgcctgc aacccagggc agggggctga gaccttccag gccctgagga840atcccgggcg ccggcaaggc ccccctcagc ccgccagctg aggggtccca cggggcaggg900gagggaattg agagtcacag acactgagcc acgcagcccc gcctctgggg ccgcctacct960ttgctggtcc cacttcagag gaggcagaaa tggaagcatt ttcaccgccc tggggtttta1020agggagcggt gtgggagtgg gaaagtccag ggactggtta agaaagttgg ataagattcc1080cccttgcacc tcgctgccca tcagaaagcc tgaggcgtgc ccagagcaca agactggggg1140caactgtaga tgtggtttct agtcctggct ctgccactaa cttgctgtgt aaccttgaac1200tacacaattc tccttcggga cctcaatttc cactttgtaa aatgagggtg gaggtgggaa1260taggatctcg aggagactat tggcatatga ttccaaggac tccagtgcct tttgaatggg1320cagaggtgag agagagagag agaaagagag agaatgaatg cagttgcatt gattcagtgc1380caaggtcact tccagaattc agagttgtga tgctctcttc tgacagccaa agatgaaaaa1440
caaacagaaa aaaaaaagta aagagtctat ttatggctga catatttacg gctgacaaac1500tcctggaaga agctatgctg cttcccagcc tggcttcccc ggatgtttgg ctacctccac1560ccctccatct caaagaaata acatcatcca ttggggtaga aaaggagagg gtccgagggt1620ggtgggaggg atagaaatca catccgcccc aacttcccaa agagcagcat ccctcccccg1680acccatagcc atgttttaaa gtcaccttcc gaagagaagt gaaaggttca aggacactgg1740ccttgcaggc ccgagggagc agccatcaca aactcacaga ccagcacatc ccttttgaga1800caccgccttc tgcccaccac tcacggacac atttctgcct agaaaacagc ttcttactgc1860tcttacatgt gatggcatat cttacactaa aagaatatta ttgggggaaa aactacaagt1920gctgtacata tgctgagaaa ctgcagagca taatagctgc cacccaaaaa tctttttgaa1980aatcatttcc agacaacctc ttactttctg tgtagttttt aattgttaaa aaaaaaaagt2040tttaaacaga agcacatgac atatgaaagc ctgcaggact ggtcgttttt ttggcaattc2100ttccacgtgg gacttgtcca caagaatgaa agtagtggtt tttaaagagt taagttacat2160atttattttc tcacttaagt tatttatgca aaagtttttc ttgtagagaa tgacaatgtt2220aatattgctt tatgaattaa cagtctgttc ttccagagtc cagagacatt gttaataaag2280acaatgaatc atgaccgaaa g 2301<210>2<211>213<212>PRT<213>Homo sapien<400>2Met Gln Leu Pro Leu Ala Leu Cys Leu Val Cys Leu Leu Val His Thr15 10 15Ala Phe Arg Val Val Glu Gly Gln Gly Trp Gln Ala Phe Lys Asn Asp20 25 30Ala Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro35 40 45Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg50 55 60Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser Cys65 70 75 80Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg Ser85 90 95Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala100 105 110Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser115 120 125Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val130 135 140Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg145 150 155 160Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln165 170 175Ser Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly180 185 190Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu195 200 205Leu Glu Asn Ala Tyr210<210>3<211>2301<212>DNA<213>Homo sapien<400>3
agagcctgtg ctactggaag gtggcgtgcc ctcctctggc tggtaccatg cagctcccac60tggccctgtg tctcgtctgc ctgctggtac acacagcctt ccgtgtagtg gagggctagg120ggtggcaggc gttcaagaat gatgccacgg aaatcatccc cgagctcgga gagtaccccg180agcctccacc ggagctggag aacaacaaga ccatgaaccg ggcggagaac ggagggcggc240ctccccacca cccctttgag accaaagacg tgtccgagta cagctgccgc gagctgcact300tcacccgcta cgtgaccgat gggccgtgcc gcagcgccaa gccggtcacc gagctggtgt360gctccggcca gtgcggcccg gcgcgcctgc tgcccaacgc catcggccgc ggcaagtggt420ggcgacctag tgggcccgac ttccgctgca tccccgaccg ctaccgcgcg cagcgcgtgc480agctgctgtg tcccggtggt gaggcgccgc gcgcgcgcaa ggtgcgcctg gtggcctcgt540gcaagtgcaa gcgcctcacc cgcttccaca accagtcgga gctcaaggac ttcgggaccg600aggccgctcg gccgcagaag ggccggaagc cgcggccccg cgcccggagc gccaaagcca660accaggccga gctggagaac gcctactaga gcccgcccgc gcccctcccc accggcgggc720gccccggccc tgaacccgcg ccccacattt ctgtcctctg cgcgtggttt gattgtttat780atttcattgt aaatgcctgc aacccagggc agggggctga gaccttccag gccctgagga840atcccgggcg ccggcaaggc ccccctcagc ccgccagctg aggggtccca cggggcaggg900gagggaattg agagtcacag acactgagcc acgcagcccc gcctctgggg ccgcctacct960ttgctggtcc cacttcagag gaggcagaaa tggaagcatt ttcaccgccc tggggtttta1020agggagcggt gtgggagtgg gaaagtccag ggactggtta agaaagttgg ataagattcc1080cccttgcacc tcgctgccca tcagaaagcc tgaggcgtgc ccagagcaca agactggggg1140caactgtaga tgtggtttct agtcctggct ctgccactaa cttgctgtgt aaccttgaac1200tacacaattc tccttcggga cctcaatttc cactttgtaa aatgagggtg gaggtgggaa1260taggatctcg aggagactat tggcatatga ttccaaggac tccagtgcct tttgaatggg1320cagaggtgag agagagagag agaaagagag agaatgaatg cagttgcatt gattcagtgc1380caaggtcact tccagaattc agagttgtga tgctctcttc tgacagccaa agatgaaaaa1440caaacagaaa aaaaaaagta aagagtctat ttatggctga catatttacg gctgacaaac1500tcctggaaga agctatgctg cttcccagcc tggcttcccc ggatgtttgg ctacctccac1560ccctccatct caaagaaata acatcatcca ttggggtaga aaaggagagg gtccgagggt1620ggtgggaggg atagaaatca catccgcccc aacttcccaa agagcagcat ccctcccccg1680acccatagcc atgttttaaa gtcaccttcc gaagagaagt gaaaggttca aggacactgg1740ccttgcaggc ccgagggagc agccatcaca aactcacaga ccagcacatc ccttttgaga1800caccgccttc tgcccaccac tcacggacac atttctgcct agaaaacagc ttcttactgc1860tcttacatgt gatggcatat cttacactaa aagaatatta ttgggggaaa aactacaagt1920gctgtacata tgctgagaaa ctgcagagca taatagctgc cacccaaaaa tctttttgaa1980aatcatttcc agacaacctc ttactttctg tgtagttttt aattgttaaa aaaaaaaagt2040tttaaacaga agcacatgac atatgaaagc ctgcaggact ggtcgttttt ttggcaattc2100ttccacgtgg gacttgtcca caagaatgaa agtagtggtt tttaaagagt taagttacat2160atttattttc tcacttaagt tatttatgca aaagtttttc ttgtagagaa tgacaatgtt2220aatattgctt tatgaattaa cagtctgttc ttccagagtc cagagacatt gttaataaag2280acaatgaatc atgaccgaaa g 2301<210>4<211>23<212>PRT<213>Homo sapien<400>4Met Gln Leu Pro Leu Ala Leu Cys Leu Val Cys Leu Leu Val His Thr1 5 10 15Ala Phe Arg Val Val Glu Gly20<210>5<211>2301<212>DNA<213>Homo sapien<400>5
agagcctgtg ctactggaag gtggcgtgcc ctcctctggc tggtaccatg cagctcccac60tggccctgtg tctcatctgc ctgctggtac acacagcctt ccgtgtagtg gagggccagg120ggtggcaggc gttcaagaat gatgccacgg aaatcatccg cgagctcgga gagtaccccg180agcctccacc ggagctggag aacaacaaga ccatgaaccg ggcggagaac ggagggcggc240ctccccacca cccctttgag accaaagacg tgtccgagta cagctgccgc gagctgcact300tcacccgcta cgtgaccgat gggccgtgcc gcagcgccaa gccggtcacc gagctggtgt360gctccggcca gtgcggcccg gcgcgcctgc tgcccaacgc catcggccgc ggcaagtggt420ggcgacctag tgggcccgac ttccgctgca tccccgaccg ctaccgcgcg cagcgcgtgc480agctgctgtg tcccggtggt gaggcgccgc gcgcgcgcaa ggtgcgcctg gtggcctcgt540gcaagtgcaa gcgcctcacc cgcttccaca accagtcgga gctcaaggac ttcgggaccg600aggccgctcg gccgcagaag ggccggaagc cgcggccccg cgcccggagc gccaaagcca660accaggccga gctggagaac gcctactaga gcccgcccgc gcccctcccc accggcgggc720gccccggccc tgaacccgcg ccccacattt ctgtcctctg cgcgtggttt gattgtttat780atttcattgt aaatgcctgc aacccagggc agggggctga gaccttccag gccctgagga840atcccgggcg ccggcaaggc ccccctcagc ccgccagctg aggggtccca cggggcaggg900gagggaattg agagtcacag acactgagcc acgcagcccc gcctctgggg ccgcctacct960ttgctggtcc cacttcagag gaggcagaaa tggaagcatt ttcaccgccc tggggtttta1020agggagcggt gtgggagtgg gaaagtccag ggactggtta agaaagttgg ataagattcc1080cccttgcacc tcgctgccca tcagaaagcc tgaggcgtgc ccagagcaca agactggggg1140caactgtaga tgtggtttct agtcctggct ctgccactaa cttgctgtgt aaccttgaac1200tacacaattc tccttcggga cctcaatttc cactttgtaa aatgagggtg gaggtgggaa1260taggatctcg aggagactat tggcatatga ttccaaggac tccagtgcct tttgaatggg1320cagaggtgag agagagagag agaaagagag agaatgaatg cagttgcatt gattcagtgc1380caaggtcact tccagaattc agagttgtga tgctctcttc tgacagccaa agatgaaaaa1440caaacagaaa aaaaaaagta aagagtctat ttatggctga catatttacg gctgacaaac1500tcctggaaga agctatgctg cttcccagcc tggcttcccc ggatgtttgg ctacctccac1560ccctccatct caaagaaata acatcatcca ttggggtaga aaaggagagg gtccgagggt1620ggtgggaggg atagaaatca catccgcccc aacttcccaa agagcagcat ccctcccccg1680acccatagcc atgttttaaa gtcaccttcc gaagagaagt gaaaggttca aggacactgg1740ccttgcaggc ccgagggagc agccatcaca aactcacaga ccagcacatc ccttttgaga1800caccgccttc tgcccaccac tcacggacac atttctgcct agaaaacagc ttcttactgc1860tcttacatgt gatggcatat cttacactaa aagaatatta ttgggggaaa aactacaagt1920gctgtacata tgctgagaaa ctgcagagca taatagctgc cacccaaaaa tctttttgaa1980aatcatttcc agacaacctc ttactttctg tgtagttttt aattgttaaa aaaaaaaagt2040tttaaacaga agcacatgac atatgaaagc ctgcaggact ggtcgttttt ttggcaattc2100ttccacgtgg gacttgtcca caagaatgaa agtagtggtt tttaaagagt taagttacat2160atttattttc tcacttaagt tatttatgca aaagtttttc ttgtagagaa tgacaatgtt2220aatattgctt tatgaattaa cagtctgttc ttccagagtc cagagacatt gttaataaag2280acaatgaatc atgaccgaaa g 2301<210>6<211>213<212>PRT<213>Homo sapien<400>6Met Gln Leu Pro Leu Ala Leu Cys Leu Ile Cys Leu Leu Val His Thr1 5 10 15Ala Phe Arg Val Val Glu Gly Gln Gly Trp Gln Ala Phe Lys Asn Asp20 25 30Ala Thr Glu Ile Ile Arg Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro35 40 45Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg50 55 60Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser Cys65 70 75 80Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg Ser
85 90 95Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala100 105 110Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser115 120 125Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val130 135 140Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg145 150 155 160Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln165 170 175Ser Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly180 185 190Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu195 200 205Leu Glu Asn Ala Tyr210<210>7<211>2301<212>DNA<213>Homo sapien<400>7agagcctgtg ctactggaag gtggcgtgcc ctcctctggc tggtaccatg cagctcccac60tggccctgtg tctcgtctgc ctgctggtac acacagcctt ccgtgtagtg gagggccagg120ggtggcaggc gttcaagaat gatgccacgg aaatcatccg cgagctcgga gagtaccccg180agcctccacc ggagctggag aacaacaaga ccatgaaccg ggcggagaac ggagggcggc240ctccccacca cccctttgag accaaagacg tgtccgagta cagctgccgc gagctgcact300tcacccgcta cgtgaccgat gggccgtgcc gcagcgccaa gccggtcacc gagctggtgt360gctccggcca gtgcggcccg gcgcgcctgc tgcccaacgc catcggccgc ggcaagtggt420ggcgacctag tgggcccgac ttccgctgca tccccgaccg ctaccgcgcg cagcgcgtgc480agctgctgtg tcccggtggt gaggcgccgc gcgcgcgcaa ggtgcgcctg gtggcctcgt540gcaagtgcaa gcgcctcacc cgcttccaca accagtcgga gctcaaggac ttcgggaccg600aggccgctcg gccgcagaag ggccggaagc cgcggccccg cgcccggagc gccaaagcca660accaggccga gctggagaac gcctactaga gcccgcccgc gcccctcccc accggcgggc720gccccggccc tgaacccgcg ccccacattt ctgtcctctg cgcgtggttt gattgtttat780atttcattgt aaatgcctgc aacccagggc agggggctga gaccttccag gccctgagga840atcccgggcg ccggcaaggc ccccctcagc ccgccagctg aggggtccca cggggcaggg900gagggaattg agagtcacag acactgagcc acgcagcccc gcctctgggg ccgcctacct960ttgctggtcc cacttcagag gaggcagaaa tggaagcatt ttcaccgccc tggggtttta1020agggagcggt gtgggagtgg gaaagtccag ggactggtta agaaagttgg ataagattcc1080cccttgcacc tcgctgccca tcagaaagcc tgaggcgtgc ccagagcaca agactggggg1140caactgtaga tgtggtttct agtcctggct ctgccactaa cttgctgtgt aaccttgaac1200tacacaattc tccttcggga cctcaatttc cactttgtaa aatgagggtg gaggtgggaa1260taggatctcg aggagactat tggcatatga ttccaaggac tccagtgcct tttgaatggg1320cagaggtgag agagagagag agaaagagag agaatgaatg cagttgcatt gattcagtgc1380caaggtcact tccagaattc agagttgtga tgctctcttc tgacagccaa agatgaaaaa1440caaacagaaa aaaaaaagta aagagtctat ttatggctga catatttacg gctgacaaac1500tcctggaaga agctatgctg cttcccagcc tggcttcccc ggatgtttgg ctacctccac1560ccctccatct caaagaaata acatcatcca ttggggtaga aaaggagagg gtccgagggt1620ggtgggaggg atagaaatca catccgcccc aacttcccaa agagcagcat ccctcccccg1680acccatagcc atgttttaaa gtcaccttcc gaagagaagt gaaaggttca aggacactgg1740ccttgcaggc ccgagggagc agccatcaca aactcacaga ccagcacatc ccttttgaga1800caccgccttc tgcccaccac tcacggacac atttctgcct agaaaacagc ttcttactgc1860tcttacatgt gatggcatat cttacactaa aagaatatta ttgggggaaa aactacaagt1920gctgtacata tgctgagaaa ctgcagagca taatagctgc cacccaaaaa tctttttgaa1980
aatcatttcc agacaacctc ttactttctg tgtagttttt aattgttaaa aaaaaaaagt2040tttaaacaga agcacatgac atatgaaagc ctgcaggact ggtcgttttt ttggcaattc2100ttccacgtgg gacttgtcca caagaatgaa agtagtggtt tttaaagagt taagttacat2160atttattttc tcacttaagt tatttatgca aaagtttttc ttgtagagaa tgacaatgtt2220aatattgctt tatgaattaa cagtctgttc ttccagagtc cagagacatt gttaataaag2280acaatgaatc atgaccgaaa g 230l<210>8<211>213<212>PRT<213>Homo sapien<400>8Met Gln Leu Pro Leu Ala Leu Cys Leu Val Cys Leu Leu Val His Thr1 5 10 15Ala Phe Arg Val Val Glu Gly Gln Gly Trp Gln Ala Phe Lys Asn Asp20 25 30Ala Thr Glu Ile Ile Arg Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro35 40 45Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg50 55 60Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser Cys65 70 75 80Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg Ser85 90 95Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala100 105 110Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser115 120 125Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val130 135 140Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg145 150 155 160Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln165 170 175Ser Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly180 185 190Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu195 200 205Leu Glu Asn Ala Tyr210<210>9<211>642<212>DNA<213>Cercopithecus pygerythrus<400>9atgcagctcc cactggccct gtgtcttgtc tgcctgctgg tacacgcagc cttccgtgta60gtggagggcc aggggtggca ggccttcaag aatgatgcca cggaaatcat ccccgagctc120ggagagtacc ccgagcctcc accggagctg gagaacaaca agaccatgaa ccgggcggag180aatggagggc ggcctcccca ccaccccttt gagaccaaag acgtgtccga gtacagctgc240cgagagctgc acttcacccg ctacgtgacc gatgggccgt gccgcagcgc caagccagtc300accgagttgg tgtgctccgg ccagtgcggc ccggcacgcc tgctgcccaa cgccatcggc360cgcggcaagt ggtggcgccc gagtgggccc gacttccgct gcatccccga ccgctaccgc420gcgcagcgtg tgcagctgct gtgtcccggt ggtgccgcgc cgcgcgcgcg caaggtgcgc480ctggtggcct cgtgcaagtg caagcgcctc acccgcttcc acaaccagtc ggagctcaag540
gacttcggtc ccgaggccgc tcggccgcag aagggccgga agccgcggcc ccgcgcccgg600ggggccaaag ccaatcaggc cgagctggag aacgcctact ag 642<210>10<211>213<212>PRT<213>Cercopithecus pygerythrus<400>10Met Gln Leu Pro Leu Ala Leu Cys Leu Val Cys Leu Leu Val His Ala1 5 10 15Ala Phe Arg Val Val Glu Gly Gln Gly Trp Gln Ala Phe Lys Asn Asp20 25 30Ala Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro35 40 45Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg50 55 60Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser Cys65 70 75 80Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg Ser85 90 95Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala100 105 110Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser115 120 125Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val130 135 140Gln Leu Leu Cys Pro Gly Gly Ala Ala Pro Arg Ala Arg Lys Val Arg145 150 155 160Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln165 170 175Ser Glu Leu Lys Asp Phe Gly Pro Glu Ala Ala Arg Pro Gln Lys Gly180 185 190Arg Lys Pro Arg Pro Arg Ala Arg Gly Ala Lys Ala Asn Gln Ala Glu195 200 205Leu Glu Asn Ala Tyr210<210>11<211>638<212>DNA<213>Mus musculus<400>11atgcagccct cactagcccc gtgcctcatc tgcctacttg tgcacgctgc cttctgtgct60gtggagggcc aggggtggca agccttcagg aatgatgcca cagaggtcat cccagggctt120ggagagtacc ccgagcctcc tcctgagaac aaccagacca tgaaccgggc ggagaatgga180ggcagacctc cccaccatcc ctatgacgcc aaaggtgtgt ccgagtacag ctgccgcgag240ctgcactaca cccgcttcct gacagacggc ccatgccgca gcgccaagcc ggtcaccgag300ttggtgtgct ccggccagtg cggccccgcg cggctgctgc ccaacgccat cgggcgcgtg360aagtggtggc gcccgaacgg accggatttc cgctgcatcc cggatcgcta ccgcgcgcag420cgggtgcagc tgctgtgccc cgggggcgcg gcgccgcgct cgcgcaaggt gcgtctggtg480gcctcgtgca agtgcaagcg cctcacccgc ttccacaacc agtcggagct caaggacttc540gggccggaga ccgcgcggcc gcagaagggt cgcaagccgc ggcccggcgc ccggggagcc600aaagccaacc aggcggagct ggagaacgcc tactagag638<210>12
<211>211<212>PRT<213>Mus musculus<400>12Met Gln Pro Ser Leu Ala Pro Cys Leu Ile Cys Leu Leu Val His Ala1 5 10 15Ala Phe Cys Ala Val Glu Gly Gln Gly Trp Gln Ala Phe Arg Asn Asp20 25 30Ala Thr Glu Val Ile Pro Gly Leu Gly Glu Tyr Pro Glu Pro Pro Pro35 40 45Glu Asn Asn Gln Thr Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro50 55 60His His Pro Tyr Asp Ala Lys Asp Val Ser Glu Tyr Ser Cys Arg Glu65 70 75 80Leu His Tyr Thr Arg Phe Leu Thr Asp Gly Pro Cys Arg Ser Ala Lys85 90 95Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala Arg Leu100 105 110Leu Pro Asn Ala Ile Gly Arg Val Lys Trp Trp Arg Pro Asn Gly Pro115 120 125Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu130 135 140Leu Cys Pro Gly Gly Ala Ala Pro Arg Ser Arg Lys Val Arg Leu Val145 150 155 160Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu165 170 175Leu Lys Asp Phe Gly Pro Glu Thr Ala Arg Pro Gln Lys Gly Arg Lys180 185 190Pro Arg Pro Gly Ala Arg Gly Ala Lys Ala Asn Gln Ala Glu Leu Glu195 200 205Asn Ala Tyr210<210>13<211>674<212>DNA<213>Rattus norvegicus<400>13gaggaccgag tgcccttcct ccttctggca ccatgcagct ctcactagcc ccttgccttg60cctgcctgct tgtacatgca gccttcgttg ctgtggagag ccaggggtgg caagccttca120agaatgatgc cacagaaatc atcccgggac tcagagagta cccagagcct cctcaggaac180tagagaacaa ccagaccatg aaccgggccg agaacggagg cagacccccc caccatcctt240atgacaccaa agacgtgtcc gagtacagct gccgcgagct gcactacacc cgcttcgtga300ccgacggccc gtgccgcagt gccaagccgg tcaccgagtt ggtgtgctcg ggccagtgcg360gccccgcgcg gctgctgccc aacgccatcg ggcgcgtgaa gtggtggcgc ccgaacggac420ccgacttccg ctgcatcccg gatcgctacc gcgcgcagcg ggtgcagctg ctgtgccccg480gcggcgcggc gccgcgctcg cgcaaggtgc gtctggtggc ctcgtgcaag tgcaagcgcc540tcacccgctt ccacaaccag tcggagctca aggacttcgg acctgagacc gcgcggccgc600agaagggtcg caagccgcgg ccccgcgccc ggggagccaa agccaaccag gcggagctgg660agaacgccta ctag 674<210>14<21l>213<212>PRT<213>Rattus norvegicus
<400>14Met Gln Leu Ser Leu Ala Pro Cys Leu Ala Cys Leu Leu Val His Ala1 5 10 15Ala Phe Val Ala Val Glu Ser Gln Gly Trp Gln Ala Phe Lys Asn Asp20 25 30Ala Thr Glu Ile Ile Pro Gly Leu Arg Glu Tyr Pro Glu Pro Pro Gln35 40 45Glu Leu Glu Asn Asn Gln Thr Met Asn Arg Ala Glu Asn Gly Gly Arg50 55 60Pro Pro His His Pro Tyr Asp Thr Lys Asp Val Ser Glu Tyr Ser Cys65 70 75 80Arg Glu Leu His Tyr Thr Arg Phe Val Thr Asp Gly Pro Cys Arg Ser85 90 95Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala100 105 110Arg Leu Leu Pro Asn Ala Ile Gly Arg Val Lys Trp Trp Arg Pro Asn115 120 125Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val130 135 140Gln Leu Leu Cys Pro Gly Gly Ala Ala Pro Arg Ser Arg Lys Val Arg145 150 155 160Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln165 170 175Ser Glu Leu Lys Asp Phe Gly Pro Glu Thr Ala Arg Pro Gln Lys Gly180 185 190Arg Lys Pro Arg Pro Arg Ala Arg Gly Ala Lys Ala Asn Gln Ala Glu195 200 205Leu Glu Asn Ala Tyr210<210>15<211>532<212>DNA<213>Bos torus<400>15agaatgatgc cacagaaatc atccccgagc tgggogagta ccccgagcct ctgccagagc60tgaacaacaa gaccatgaac cgggcggaga acggagggag acctccccac cacccctttg120agaccaaaga cgcctccgag tacagctgcc gggagctgca cttcacccgc tacgtgaccg180atgggccgtg ccgcagcgcc aagccggtca ccgagctggt gtgctcgggc cagtgcggcc240cggcgcgcct gctgcccaac gccatcggcc gcggcaagtg gtggcgccca agcgggcccg300acttccgctg catccccgac cgctaccgcg cgcagcgggt gcagctgttg tgtcctggcg360gcgcggcgcc gcgcgcgcgc aaggtgcgcc tggtggcctc gtgcaagtgc aagcgcctca420ctcgcttcca caaccagtcc gagctcaagg acttcgggcc cgaggccgcg cggccgcaaa480cgggccggaa gctgcggccc cgcgcccggg gcaccaaagc cagccgggcc ga532<210>16<211>176<212>PRT<213>Bos torus<400>16Asn Asp Ala Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro1 5 10 15Leu Pro Glu Leu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly20 25 30
Arg Pro Pro His His Pro Phe Glu Thr Lys Asp Ala Ser Glu Tyr Ser35 40 45Cys Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg50 55 60Ser Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro65 70 75 80Ala Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro85 90 95Ser Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg100 105 110Va1 Gln Leu Leu Cys Pro Gly Gly Ala Ala Pro Arg Ala Arg Lys Val115 120 125Arg Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn130 135 140Gln Ser Glu Leu Lys Asp Phe Gly Pro Glu Ala Ala Arg Pro Gln Thr145 150 155 160Gly Arg Lys Leu Arg Pro Arg Ala Arg Gly Thr Lys Ala Ser Arg Ala165 170 175<210>17<211>35828<212>DNA<213>Mus musculus<220>
<221>misc feature<222>(1)..(35828)<223>n=A,T,C或G<400>17cgcgttttgg tgagcagcaa tattgcgctt cgatgagcct tggcgttgag attgatacct60ctgctgcaca aaaggcaatc gaccgagctg gaccagcgca ttcgtgacac cgtctccttc120gaacttattc gcaatggagt gtcattcatc aaggachgcc tgatcgcaaa tggtgctatc180cacgcagcgg caatcgaaaa ccctcagccg gtgaccaata tctacaacat cagccttggt240atcctgcgtg atgagccagc gcagaacaag gtaaccgtca gtgccgataa gttcaaagtt300aaacctggtg ttgataccaa cattgaaacg ttgatcgaaa acgcgctgaa aaacgctgct360gaatgtgcgg cgctggatgt cacaaagcaa atggcagcag acaagaaagc gatggatgaa420ctggcttcct atgtccgcac ggccatcatg atggaatgtt tccccggtgg tgttatctgg480cagcagtgcc gtcgatagta tgcaattgat aattattatc atttgcgggt cctttccggc540gatccgcctt gttacggggc ggcgacctcg cgggttttcg ctatttatga aaattttccg600gtttaaggcg tttccgttct tcttcgtcat aacttaatgt ttttatttaa aataccctct660gaaaagaaag gaaacgacag gtgctgaaag cgagcttttt ggcctctgtc gtttcctttc720tctgtttttg tccgtggaat gaacaatgga agtcaacaaa aagcagagct tatcgatgat780aagcggtcaa acatgagaat tcgcggccgc ataatacgac tcactatagg gatcgacgcc840tactccccgc gcatgaagcg gaggagctgg actccgcatg cccagagacg ccccccaacc900cccaaagtgc ctgacctcag cctctaccag ctctggcttg ggcttgggcg gggtcaaggc960taccacgttc tcttaacagg tggctgggct gtctcttggc cgcgcgtcat gtgacagctg1020cctagttctg cagtgaggtc accgtggaat gtctgccttc gttgccatgg caacgggatg1080acgttacaat ctgggtgtgg agcttttcct gtccgtgtca ggaaatccaa ataccctaaa1140ataccctaga agaggaagta gctgagccaa ggctttcctg gcttctccag ataaagtttg1200acttagatgg aaaaaaacaa aatgataaag acccgagcca tctgaaaatt cctcctaatt1260gcaccactag gaaatgtgta tattattgag ctcgtatgtg ttcttatttt aaaaagaaaa1320ctttagtcat gttattaata agaatttctc agcagtggga gagaaccaat attaacacca1380agataaaagt tggcatgatc cacattgcag gaagatccac gttgggtttt catgaatgtg1440aagaccccat ttattaaagt cctaagctct gtttttgcac actaggaagc gatggccggg1500atggctgagg ggctgtaagg atctttcaat gtcttacatg tgtgtttcct gtcctgcacc1560taggacctgc tgcctagcct gcagcagagc cagaggggtt tcacatgatt agtctcagac1620
acttgggggc aggttgcatg tactgcatcg cttatttcca tacggagcac ctactatgtg1680tcaaacacca tatggtgttc actcttcaga acggtggtgg tcatcatggt gcatttgctg1740acggttggat tggtggtaga gagctgagat atatggacgc actcttcagc attctgtcaa1800cgtggctgtg cattcttgct cctgagcaag tggctaaaca gactcacagg gtcagcctcc1860agctcagtcg ctgcatagtc ttagggaacc tctcccagtc ctccctacct caactatcca1920agaagccagg gggcttggcg gtctcaggag cctgcttgct gggggacagg ttgttgagtt1980ttatctgcag taggttgcct aggcatagtg tcaggactga tggctgcctt ggagaacaca2040tcctttgccc tctatgcaaa tctgaccttg acatgggggc gctgctcagc tgggaggatc2100aactgcatac ctaaagccaa gcctaaagct tcttcgtcca cctgaaactc ctggaccaag2160gggcttccgg cacatcctct caggccagtg agggagtctg tgtgagctgc actttccaat2220ctcagggcgt gagaggcaga gggaggtggg ggcagagcct tgcagctctt tcctcccatc2280tggacagcgc tctggctcag cagcccatat gagcacaggc acatccccac cccaccccca2340cctttcctgt cctgcagaat ttaggctctg ttcacggggg gggggggggg ggggcagtcc2400tatcctctct taggtagaca ggactctgca ggagacactg ctttgtaaga tactgcagtt2460taaatttgga tgttgtgagg ggaaagcgaa gggcctcttt gaccattcag tcaaggtacc2520ttctaactcc catcgtattg gggggctact ctagtgctag acattgcaga gagcctcaga2580actgtagtta ccagtgtggt aggattgatc cttcagggag cctgacatgt gacagttcca2640ttcttcaccc agtcaccgaa catttattca gtacctaccc cgtaacaggc accgtagcag2700gtactgaggg acggaccact caaagaactg acagaccgaa gccttggaat ataaacacca2760aagcatcagg ctctgccaac agaacactct ttaacactca ggccctttaa cactcaggac2820ccccaccccc accccaagca gttggcactg ctatccacat tttacagaga ggaaaaacta2880ggcacaggac gatataagtg gcttgcttaa gcttgtctgc atggtaaatg gcagggctgg2940attgagaccc agacattcca actctagggt ctatttttct tttttctcgt tgttcgaatc3000tgggtcttac tgggtaaact caggctagcc tcacactcat atccttctcc catggcttac3060gagtgctagg attccaggtg tgtgctacca tgtctgactc cctgtagctt gtctatacca3120tcctcacaac ataggaattg tgatagcagc acacacaccg gaaggagctg gggaaatccc3180acagagggct ccgcaggatg acaggcgaat gcctacacag aaggtgggga agggaagcag3240agggaacagc atgggcgtgg gaccacaagt ctatttgggg aagctgccgg taaccgtata3300tggctggggt gaggggagag gtcatgagat gaggcaggaa gagccacagc aggcagcggg3360tacgggctcc ttattgccaa gaggctcgga tcttcctcct cttcctcctt ccggggctgc3420ctgttcattt tccaccactg cctcccatcc aggtctgtgg ctcaggacat cacccagctg3480cagaaactgg gcatcaccca cgtcctgaat gctgccgagg gcaggtcctt catgcacgtc3540aacaccagtg ctagcttcta cgaggattct ggcatcacct acttgggcat caaggccaat3600gatacgcagg agttcaacct cagtgcttac tttgaaaggg ccacagattt cattgaccag3660gcgctggccc ataaaaatgg taaggaacgt acattccggc acccatggag cgtaagccct3720ctgggacctg cttcctccaa agaggccccc acttgaaaaa ggttccagaa agatcccaaa3780atatgccacc aactagggat taagtgtcct acatgtgagc cgatgggggc cactgcatat3840agtctgtgcc atagacatga caatggataa taatatttca gacagagagc aggagttagg3900tagctgtgct cctttccctt taattgagtg tgcccatttt tttattcatg tatgtgtata3960catgtgtgtg cacacatgcc ataggttgat actgaacacc gtcttcaatc gttccccacc4020ccaccttatt ttttgaggca gggtctcttc cctgatcctg gggctcattg gtttatctag4080gctgctggcc agtgagctct ggagttctgc ttttctctac ctccctagcc ctgggactgc4140aggggcatgt gctgggccag gcttttatgt cgcgttgggg atctgaactt aggtccctag4200gcctgagcac cgtaaagact ctgccacatc cccagcctgt ttgagcaagt gaaccattcc4260ccagaattcc cccagtgggg ctttcctacc cttttattgg ctaggcattc atgagtggtc4320acctcgccag aggaatgagt ggccacgact ggctcagggt cagcagccta gagatactgg4380gttaagtctt cctgccgctc gctccctgca gccgcagaca gaaagtagga ctgaatgaga4440gctggctagt ggtcagacag gacagaaggc tgagagggtc acagggcaga tgtcagcaga4500gcagacaggt tctccctctg tgggggaggg gtggcccact gcaggtgtaa ttggccttct4560ttgtgctcca tagaggcttc ctgggtacac agcagcttcc ctgtcctggt gattcccaaa4620gagaactccc taccactgga cttacagaag ttctattgac tggtgtaacg gttcaacagc4680tttggctctt ggtggacggt gcatactgct gtatcagctc aagagctcat tcacgaatga4740acacacacac acacacacac acacacacac acacaagcta attttgatat gccttaacta4800gctcagtgac tgggcatttc tgaacatccc tgaagttagc acacatttcc ctctggtgtt4860cctggcttaa caccttctaa atctatattt tatctttgct gccctgttac cttctgagaa4920gcccctaggg ccacttccct tcgcacctac attgctggat ggtttctctc ctgcagctct4980taaatctgat ccctctgcct ctgagccatg ggaacagccc aataactgag ttagacataa5040
aaacgtctct agccaaaact tcagctaaat ttagacaata aatcttactg gttgtggaat5100ccttaagatt cttcatgacc tccttcacat ggcacgagta tgaagcttta ttacaattgt5160ttattgatca aactaactca taaaaagcca gttgtctttc acctgctcaa ggaaggaaca5220aaattcatcc ttaactgatc tgtgcacctt gcacaatcca tacgaatatc ttaagagtac5280taagattttg gttgtgagag tcacatgtta cagaatgtac agctttgaca aggtgcatcc5340ttgggatgcc gaagtgacct gctgttccag ccccctacct tctgaggctg ttttggaagc5400aatgctctgg aagcaacttt aggaggtagg atgctggaac agcgggtcac ttcagcatcc5460cgatgacgaa tcccgtcaaa gctgtacatt ctgtaacaga ctgggaaagc tgcagacttt5520aaggccaggg ccctatggtc cctcttaatc cctgtcacac ccaacccgag cccttctcct5580ccagccgttc tgtgcttctc actctggata gatggagaac acggccttgc tagttaaagg5640agtgaggctt cacccttctc acatggcagt ggttggtcat cctcattcag ggaactctgg5700ggcattctgc ctttacttcc tctttttgga ctacagggaa tatatgctga cttgttttga5760ccttgtgtat ggggagactg gatctttggt ctggaatgtt tcctgctagt ttttccccat5820cctttggcaa accctatcta tatcttacca ctaggcatag tggccctcgt tctggagcct5880gccttcaggc tggttctcgg ggaccatgtc cctggtttct ccccagcata tggtgttcac5940agtgttcact gcgggtggtt gctgaacaaa gcggggattg catcccagag ctccggtgcc6000ttgtgggtac actgctaaga taaaatggat actggcctct ctctgaccac ttgcagagct6060ctggtgcctt gtgggtacac tgctaagata aaatggatac tggcctctct ctatccactt6120gcaggactct agggaacagg aatccattac tgagaaaacc aggggctagg agcagggagg6180tagctgggca gctgaagtgc ttggcgacta accaatgaat accagagttt ggatctctag6240aatactctta aaatctgggt gggcagagtg gcctgcctgt aatcccagaa ctcgggaggc6300ggagacaggg aatcatcaga gcaaactggc taaccagaat agcaaaacac tgagctctgg6360gctctgtgag agatcctgcc ttaacatata agagagagaa taaaacattg aagaagacag6420tagatgccaa ttttaagccc ccacatgcac atggacaagt gtgcgtttga acacacatat6480gcactcatgt gaaccaggca tgcacactcg ggcttatcac acacataatt tgaaagagag6540agtgagagag gagagtgcac attagagttc acaggaaagt gtgagtgagc acacccatgc6600acacagacat gtgtgccagg gagtaggaaa ggagcctggg tttgtgtata agagggagcc6660atcatgtgtt tctaaggagg gcgtgtgaag gaggcgttgt gtgggctggg actggagcat6720ggttgtaact gagcatgctc cctgtgggaa acaggagggt ggccaccctg cagagggtcc6780cactgtccag cgggatcagt aaaagcccct gctgagaact ttaggtaata gccagagaga6840gaaaggtagg aaagtggggg gactcccatc tctgatgtag gaggatctgg gcaagtagag6900gtgcgtttga ggtagaaaga ggggtgcaga ggagatgctc ttaattctgg gtcagcagtt6960tctttccaaa taatgcctgt gaggaggtgt aggtggtggc cattcactca ctcagcagag7020ggatgatgat gcccggtgga tgctggaaat ggccgagcat caaccctggc tctggaagaa7080ctccatcttt cagaaggaga gtggatctgt gtatggccag cggggtcaca ggtgcttggg7140gcccctgggg gactcctagc actgggtgat gtttatcgag tgctcttgtg tgccaggcac7200tggcctgggg ctttgtttct gtctctgttt tgtttcgttt tttgagacag actcttgcta7260tgtatccgtg tcaatcttgg aatctcactg catagcccag gctgcggaga gaggggaggg7320caataggcct tgtaagcaag ccacacttca gagactagac tccaccctgc gaatgatgac7380aggtcagagc tgagttccgg aagatttttt ttccagctgc caggtggagt gtggagtggc7440agctagcggc aagggtagag ggcgagctcc ctgtgcagga gaaatgcaag caagagatgg7500caagccagtg agttaagcat tctgtgtggg gagcaggtgg atgaagagag aggctgggct7560ttcgcctctg gggggggggt gaggggtggg gatgaggtga gaggagggca gctccctgca7620gtgtgatgag atttttcctg acagtgacct ttggcctctc cctcccccac ttcccttctt7680tcctttcttc ccaccattgc tttccttgtc cttgagaaat tctgagtttc cacttcactg7740gtgatgcaga cggaaacaga agccgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt7800gtgtgtgtgt ttgtgtgtat gtgtgtgtgt gtgtttgtgt gtatgtgtgt cagtgggaat7860ggctcatagt ctgcaggaag gtgggcagga aggaataagc tgtaggctga ggcagtgtgg7920gatgcaggga gagaggagag gagggatacc agagaaggaa attaagggag ctacaagagg7980gcattgttgg ggtgtgtgtg tgtgtgtgtt gtttatattt gtattggaaa tacattcttt8040taaaaaatac ttatccattt atttattttt atgtgcacgt gtgtgtgcct gcatgagttc8100atgtgtgcca cgtgtgtgcg ggaacccttg gaggccacaa gggggcatct gatcccctgg8160aactggagtt ggaggaggtt gtgagtcccc tgacatgttt gctgggaact gaaccccggt8220cctatgcaag agcaggaagt gcagttatct gctgagccat ctctccagtc ctgaaatcca8280ttctcttaaa atacacgtgg cagagacatg atgggattta cgtatggatt taatgtggcg8340gtcattaagt tccggcacag gcaagcacct gtaaagccat caccacaacc gcaacagtga8400atgtgaccat cacccccatg ttcttcatgt cccctgtccc ctccatcctc cattctcaag8460
cacctcttgc tctgcctctg tcgctggaga acagtgtgca tctgcacact cttatgtcag8520tgaagtcaca cagcctgcac cccttcctgg tctgagtatt tgggttctga ctctgctatc8580acacactact gtactgcatt ctctcgctct ctttttttaa acatattttt atttgtttgt8640gtgtatgcac atgtgccaca tgtgtacaga tactatggag gccagaagag gccatggccg8700tccctggagc tggagttaca ggcagcgtgt gagctgcctg gtgtgggtgc tgggaaccaa8760acttgaatct aaagcaagca cttttaactg ctgaggcagc tctcagtacc cttcttcatt8820tctccgcctg ggttccattg tatggacaca tgtagctaga atatcttgct tatctaatta8880tgtacattgt tttgtgctaa gagagagtaa tgctctatag cctgagctgg cctcaacctt8940gccatcctcc tgcctcagcc tcctcctcct gagtgctagg atgacaggcg agtggtaact9000tacatggttt catgttttgt tcaagactga aggataacat tcatacagag aaggtctggg9060tcacaaagtg tgcagttcac tgaatggcac aacccgtgat caagaaacaa aactcagggg9120ctggagagat ggcactgact gctcttccag aggtccggag ttcaattccc agcaaccaca9180tggtggctca cagccatcta taacgagatc tgacgccctc ttctggtgtg tctgaagaca9240gctacagtgt actcacataa aataaataaa tctttaaaac acacacacac acacaattac9300caccccagaa agcccactcc atgttccctc ccacgtctct gcctacagta ctcccaggtt9360accactgttc aggcttctaa caacctggtt tacttgggcc tcttttctgc tctgtggagc9420cacacatttg tgtgcctcat acacgttctt tctagtaagt tgcatattac tctgcgtttt9480tacatgtatt tatttattgt agttgtgtgt gcgtgtgggc ccatgcatgg cacagtgtgt9540ggggatgtca gagtattgtg aacaggggac agttcttttc ttcaatcatg tgggttccag9600aggttgaact caggtcatca tgtgtggcag caaatgcctt tacccactga gacatctcca9660tattcttttt ttttcccctg aggtgggggc ttgttccata gcccaaactg gctttgcact9720tgcagttcaa agtgactccc tgtctccacc tcttagagta ttggaattac gatgtgtact9780accacacctg actggatcat taattctttg atgggggcgg ggaagcgcac atgctgcagg9840tgaagggatg actggactgg acatgagcgt ggaagccaga gaacagcttc agtctaatgc9900tctcccaact gagctatttc ggtttgccag agaacaactt acagaaagtt ctcagtgcca9960tgtggattcg gggttggagt tcaactcatc agcttgacat tggctcctct acccactgag10020ccttctcact actctctacc tagatcatta attctttttt aaaaagactt attagggggc10080tggagagatg gctcagccgt taagagcacc gaatgccctt ccagaggtcc tgagttcaat10140tcccagcatg ccattgctgg gcagtagggg gcgcaggtgt tcaacgtgag tagctgttgc10200cagttttccg cggtggagaa cctcttgaca ccctgctgtc cctggtcatt ctgggtgggt10260gcatggtgat atgcttgttg tatggaagac tttgactgtt acagtgaagt tgggcttcca10320cagttaccac gtctcccctg tttcttgcag gccgggtgct tgtccattgc cgcgagggct10380acagccgctc cccaacgcta gttatcgcct acctcatgat gcggcagaag atggacgtca10440agtctgctct gagtactgtg aggcagaatc gtgagatcgg ccccaacgat ggcttcctgg10500cccaactctg ccagctcaat gacagactag ccaaggaggg caaggtgaaa ctctagggtg10560cccacagcct cttttgcaga ggtctgactg ggagggccct ggcagccatg tttaggaaac10620acagtatacc cactccctgc accaccagac acgtgcccac atctgtccca ctctggtcct10680cgggggccac tccaccctta gggagcacat gaagaagctc cctaagaagt tctgctcctt10740agccatcctttcctgtaatt tatgtctctc cctgaggtga ggttcaggtt tatgtccctg10800tctgtggcat agatacatct cagtgaccca gggtgggagg gctatcaggg tgcatggccc10860gggacacggg cactcttcat gacccctccc ccacctgggt tcttcctgtg tggtccagaa10920ccacgagcct ggtaaaggaa ctatgcaaac acaggccctg acctccccat gtctgttcct10980ggtcctcaca gcccgacacg ccctgctgag gcagacgaat gacattaagt tctgaagcag11040agtggagata gattagtgac tagatttcca aaaagaagga aaaaaaaggc tgcattttaa11100aattatttcc ttagaattaa agatactaca taggggccct tgggtaagca aatccatttt11160tcccagaggc tatcttgatt ctttggaatg tttaaagtgt gccttgccag agagcttacg11220atctatatct gctgcttcag agccttccct gaggatggct ctgttccttt gcttgttaga11280agagcgatgc cttgggcagg gtttccccct tttcagaata cagggtgtaa agtccagcct11340attacaaaca aacaaacaaa caaacaaaca aaggacctcc atttggagaa ttgcaaggat11400tttatcctga attatagtgt tggtgagttc aagtcatcac gccaagtgct tgccatcctg11460gttgctattc taagaataat taggaggagg aacctagcca attgcagctc atgtccgtgg11520gtgtgtgcac gggtgcatat gttggaaggg gtgcctgtcc ccttggggac agaaggaaaa11580tgaaaggccc ctctgctcac cctggccatt tacgggaggc tctgctggtt ccacggtgtc11640tgtgcaggat cctgaaactg actcgctgga cagaaacgag acttggcggc accatgagaa11700tggagagaga gagagcaaag aaagaaacag cctttaaaag aactttctaa gggtggtttt11760tgaacctcgc tggaccttgt atgtgtgcac atttgccaga gattgaacat aatcctcttg11820ggacttcacg ttctcattat ttgtatgtct ccggggtcac gcagagccgt cagccaccac11880
cccagcaccc ggcacatagg cgtctcataa aagcccattt tatgagaacc agagctgttt11940gagtaccccg tgtatagaga gagttgttgt cgtggggcac ccggatccca gcagcctggt12000tgcctgcctg taggatgtct tacaggagtt tgcagagaaa ccttccttgg agggaaagaa12060atatcaggga tttttgttga atatttcaaa ttcagcttta agtgtaagac tcagcagtgt12120tcatggttaa ggtaaggaac atgccttttc cagagctgct gcaagaggca ggagaagcag12180acctgtctta ggatgtcact cccagggtaa agacctctga tcacagcagg agcagagctg12240tgcagcctgg atggtcattg tcccctattc tgtgtgacca cagcaaccct ggtcacatag12300ggctggtcat cctttttttt tttttttttt tttttttttg gcccagaatg aagtgaccat12360agccaagttg tgtacctcag tctttagttt ccaagcggct ctcttgctca atacaatgtg12420catttcaaaa taacactgta gagttgacag aactggttca tgtgttatga gagaggaaaa12480gagaggaaag aacaaaacaa aacaaaacac cacaaaccaa aaacatctgg gctagccagg12540catgattgca atgtctacag gcccagttca tgagaggcag agacaggaag accgccgaaa12600ggtcaaggat agcatggtct acgtatcgag actccagcca gggctacggt cccaagatcc12660taggttttgg attttgggct ttggtttttg agacagggtt tctctgtgta gccctggctg12720tcctggaact cgctctgtag accaggctgg cctcaaactt agagatctgc ctgactctgc12780ctttgagggc tgggacgaat gccaccactg cccaactaag attccattaa aaaaaaaaaa12840agttcaagat aattaagagt tgccagctcg ttaaagctaa gtagaagcag tctcaggcct12900gctgcttgag gctgttcttg gcttggacct gaaatctgcc cccaacagtg tccaagtgca12960catgactttg agccatctcc agagaaggaa gtgaaaattg tggctcccca gtcgattggg13020acacagtctc tctttgtcta ggtaacacat ggtgacacat agcattgaac tctccactct13080gagggtgggt ttccctcccc ctgcctcttc tgggttggtc accccatagg acagccacag13140gacagtcact agcacctact ggaaacctct ttgtgggaac atgaagaaag agcctttggg13200agattcctgg ctttccatta gggctgaaag tacaacggtt cttggttggc tttgcctcgt13260gtttataaaa ctagctacta ttcttcaggt aaaataccga tgttgtggaa aagccaaccc13320cgtggctgcc cgtgagtagg gggtggggtt gggaatcctg gatagtgttc tatccatgga13380aagtggtgga ataggaatta agggtgttcc cccccccccc aacctcttcc tcagacccag13440ccactttcta tgacttataa acatccaggt aaaaattaca aacataaaaa tggtttctct13500tctcaatctt ctaaagtctg cctgcctttt ccaggggtag gtctgtttct ttgctgttct13560attgtcttga gagcacagac taacacttac caaatgaggg aactcttggc ccatactaag13620gctcttctgg gctccagcac tcttaagtta ttttaagaat tctcacttgg cctttagcac13680acccgccacc cccaagtggg tgtggataat gccatggcca gcagggggca ctgttgaggc13740gggtgccttt ccaccttaag ttgcttatag tatttaagat gctaaatgtt ttaatcaaga13800gaagcactga tcttataata cgaggataag agattttctc acaggaaatt gtctttttca13860taattctttt acaggctttg tcctgatcgt agcatagaga gaatagctgg atatttaact13920tgtattccat tttcctctgc cagcgttagg ttaactccgt aaaaagtgat tcagtggacc13980gaagaggctc agagggcagg ggatggtggg gtgaggcaga gcactgtcac ctgccaggca14040tgggaggtcc tgccatccgg gaggaaaagg aaagtttagc ctctagtcta ccaccagtgt14100taacgcactc taaagttgta accaaaataa atgtcttaca ttacaaagac gtctgttttg14160tgtttccttt tgtgtgtttg ggctttttat gtgtgcttta taactgctgt ggtggtgctg14220ttgttagttt tgaggtagga tctcaggctg gccttgaact tctgatcgcc tgcccctgcc14280cctgcccctg cccctgtccc tgcctccaag tgctaggact aaaagcacat gccaccacac14340cagtacagca tttttctaac atttaaaaat aatcacctag gggctggaga gagggttcca14400gctaagagtg cacactgctc ttgggtagga cctgagttta gttcccagaa cctatactgg14460gtggctccag gtccagagga tccaggacct ctggcctcca tgggcatctg ctcttagcac14520atacccacat acagatacac acataaaaat aaaatgaagc ctttaaaaac ctcctaaaac14580ctagcccttg gaggtacgac tctggaaagc tggcatactg tgtaagtcca tctcatggtg14640ttctggctaa cgtaagactt acagagacag aaaagaactc agggtgtgct gggggttggg14700atggaggaag agggatgagt agggggagca cggggaactt gggcagtgaa aattctttgc14760aggacactag aggaggataa ataccagtca ttgcacccac tactggacaa ctccagggaa14820ttatgctggg tgaaaagaga aggccccagg tattggctgc attggctgca tttgcgtaac14880atttttttaa attgaaaaga aaaagatgta aatcaaggtt agatgagtgg ttgctgtgag14940ctgagagctg gggtgagtga gacatgtgga caactccatc aaaaagcgac agaaagaacg15000ggctgtggtg acagctacct ctaatctcca cctccgggag gtgatcaagg ttagccctca15060gctagcctgt ggtgcatgag accctgtttc aaaaacttta ataaagaaat aatgaaaaaa15120gacatcaggg cagatccttg gggccaaagg cggacaggcg agtctcgtgg taaggtcgtg15180tagaagcgga tgcatgagca cgtgccgcag gcatcatgag agagccctag gtaagtaagg15240atggatgtga gtgtgtcggc gtcggcgcac tgcacgtcct ggctgtggtg ctggactggc15300
atctttggtg agctgtggag gggaaatggg tagggagatc ataaaatccc tccgaattat15360ttcaagaact gtctattaca attatctcaa aatattaaaa aaaaagaaga attaaaaaac15420aaaaaaccta tccaggtgtg gtggtgtgca cctatagcca cgggcacttg gaaagctgga15480gcaagaggat ggcgagtttg aaggtatctg gggctgtaca gcaagaccgt cgtccccaaa15540ccaaaccaaa cagcaaaccc attatgtcac acaagagtgt ttatagtgag cggcctcgct15600gagagcatgg ggtgggggtg ggggtggggg acagaaatat ctaaactgca gtcaataggg15660atccactgag accctggggc ttgactgcag cttaaccttg ggaaatgata agggttttgt15720gttgagtaaa agcatcgatt actgacttaa cctcaaatga agaaaaagaa aaaaagaaaa15780caacaaaagc caaaccaagg ggctggtgag atggctcagt gggtaagagc acccgactgc15840tcttccgaag gtccagagtt caaatcccag caaccacatg gtggctcaca accatctgta15900acgagatatg atgccctctt ctggtgtgtc tgaagacagc tacagtgtac ttacatataa15960taaataaatc ttaaaaaaaa aaaaaaaaaa aaaagccaaa ccgagcaaac caggccccca16020aacagaaggc aggcacgacg gcaggcacca cgagccatcc tgtgaaaagg cagggctacc16080catgggccga ggagggtcca gagagatagg ctggtaagct cagtttctct gtataccctt16140tttcttgttg acactacttc aattacagat aaaataacaa ataaacaaaa tctagagcct16200ggccactctc tgctcgcttg atttttcctg ttacgtccag caggtggcgg aagtgttcca16260aggacagatc gcatcattaa ggtggccagc ataatctccc atcagcaggt ggtgctgtga16320gaaccattat ggtgctcaca gaatcccggg cccaggagct gccctctccc aagtctggag16380caataggaaa gctttctggc ccagacaggg ttaacagtcc acattccaga gcaggggaaa16440aggagactgg aggtcacaga caaaagggcc agcttctaac aacttcacag ctctggtagg16500agagatagat cacccccaac aatggccaca gctggttttg tctgccccga aggaaactga16560cttaggaagc aggtatcaga gtccccttcc tgaggggact tctgtctgcc ttgtaaagct16620gtcagagcag ctgcattgat gtgtgggtga cagaagatga aaaggaggac ccaggcagat16680cgccacagat ggaccggcca cttacaagtc gaggcaggtg gcagagcctt gcagaagctc16740tgcaggtgga cgacactgat tcattaccca gttagcatac cacagcgggc taggcggacc16800acagcctcct tcccagtctt cctccagggc tggggagtcc tccaaccttc tgtctcagtg16860cagcttccgc cagcccctcc tccttttgca cctcaggtgt gaaccctccc tcctctcctt16920ctccctgtgg catggccctc ctgctactgc aggctgagca ttggatttct ttgtgcttag16980atagacctga gatggctttc tgatttatat atatatatcc atcccttgga tcttacatct17040aggacccaga gctgtttgtg ataccataag aggctgggga gatgatatgg taagagtgct17100tgctgtacaa gcatgaagac atgagttcga atccccagca accatgtgga aaaataacct17160tctaacctca gagttgaggg gaaaggcagg tggattctgg gggcttactg gccagctagc17220cagcctaacc taaatgtctc agtcagagat cctgtctcag ggaataactt gggagaatga17280ctgagaaaga cacctcctca ggtctcccat gcacccacac agacacacgg ggggggggta17340atgtaataag ctaagaaata atgagggaaa tgattttttg ctaagaaatg aaattctgtg17400ttggccgcaa gaagcctggc cagggaagga actgcctttg gcacaccagc ctataagtca17460ccatgagttc cctggctaag aatcacatgt aatggagccc aggtccctct tgcctggtgg17520ttgcctctcc cactggtttt gaagagaaat tcaagagaga tctccttggt cagaattgta17580ggtgctgagc aatgtggagc tggggtcaat gggattcctt taaaggcatc cttcccaggg17640ctgggtcata cttcaatagt agggtgcttg cacagcaagc gtgagaccct aggttagagt17700ccccagaatc tgcccccaac cccccaaaaa ggcatccttc tgcctctggg tgggtggggg17760gagcaaacac ctttaactaa gaccattagc tggcaggggt aacaaatgac cttggctaga17820ggaatttggt caagctggat tccgccttct gtagaagccc cacttgtttc ctttgttaag17880ctggcccaca gtttgttttg agaatgcctg aggggcccag ggagccagac aattaaaagc17940caagctcatt ttgatatctg aaaaccacag cctgactgcc ctgcccgtgg gaggtactgg18000gagagctggc tgtgtccctg cctcaccaac gccccccccc ccaacacaca ctcctcgggt18060cacctgggag gtgccagcag caatttggaa gtttactgag cttgagaagt cttgggaggg18120ctgacgctaa gcacacccct tctccacccc cccccacccc acccccgtga ggaggagggt18180gaggaaacat gggaccagcc ctgctccagc ccgtccttat tggctggcat gaggcagagg18240gggctttaaa aaggcaaccg tatctaggct ggacactgga gcctgtgcta ccgagtgccc18300tcctccacct ggcagcatgc agccctcact agccccgtgc ctcatctgcc tacttgtgca18360cgctgccttc tgtgctgtgg agggccaggg gtggcaagcc ttcaggaatg atgccacaga18420ggtcatccca gggcttggag agtaccccga gcctcctcct gagaacaacc agaccatgaa18480ccgggcggag aatggaggca gacctcccca ccatccctat gacgccaaag gtacgggatg18540aagaagcaca ttagtggggg ggggggtcct gggaggtgac tggggtggtt ttagcatctt18600cttcagaggt ttgtgtgggt ggctagcctc tgctacatca gggcagggac acatttgcct18660ggaagaatac tagcacagca ttagaacctg gagggcagca ttggggggct ggtagagagc18720
acccaaggca gggtggaggc tgaggtcagc cgaagctggc attaacacgg gcatgggctt18780gtatgatggt ccagagaatc tcctcctaag gatgaggaca caggtcagat ctagctgctg18840accagtgggg aagtgatatg gtgaggctgg atgccagatg ccatccatgg ctgtactata18900tcccacatga ccaccacatg aggtaaagaa ggccccagct tgaagatgga gaaaccgaga18960ggctcctgag ataaagtcac ctgggagtaa gaagagctga gactggaagc tggtttgatc19020cagatgcaag gcaaccctag attgggtttg ggtgggaacc tgaagccagg aggaatccct19080ttagttcccc cttgcccagg gtctgctcaa tgagcccaga gggttagcat taaaagaaca19140gggtttgtag gtggcatgtg acatgagggg cagctgagtg aaatgtcccc tgtatgagca19200caggtggcac cacttgccct gagcttgcac cctgacccca gctttgcctc attcctgagg19260acagcagaaa ctgtggaggc agagccagca cagagagatg cctggggtgg gggtgggggt19320atcacgcacg gaactagcag caatgaatgg ggtggggtgg cagctggagg gacactccag19380agaaatgacc ttgctggtca ccatttgtgt gggaggagag ctcattttcc agcttgccac19440cacatgctgt ccctcctgtc tcctagccag taagggatgt ggaggaaagg gccaccccaa19500aggagcatgc aatgcagtca cgtttttgca gaggaagtgc ttgacctaag ggcactattc19560ttggaaagcc ccaaaactag tccttccctg ggcaaacagg cctcccccac ataccacctc19620tgcaggggtg agtaaattaa gccagccaca gaagggtggc aaggcctaca cctcccccct19680gttgtgcccc cccccccccc gtgaaggtgc atcctggcct ctgcccctct ggctttggta19740ctgggatttt ttttttcctt ttatgtcata ttgatcctga caccatggaa cttttggagg19800tagacaggac ccacacatgg attagttaaa agcctcccat ccatctaagc tcatggtagg19860agatagagca tgtccaagag aggagggcag gcatcagacc tagaagatat ggctgggcat19920ccaacccaat ctccttcccc ggagaacaga ctctaagtca gatccagcca cccttgagta19980accagctcaa ggtacacaga acaagagagt ctggtataca gcaggtgcta aacaaatgct20040tgtggtagca aaagctatag gttttgggtc agaactccga cccaagtcgc gagtgaagag20100cgaaaggccc tctactcgcc accgccccgc ccccacctgg ggtcctataa cagatcactt20160tcacccttgc gggagccaga gagccctggc atcctaggta gccccccccg cccccccccc20220gcaagcagcc cagccctgcc tttggggcaa gttcttttct cagcctggac ctgtgataat20280gagggggttg gacgcgccgc ctttggtcgc tttcaagtct aatgaattct tatccctacc20340acctgccctt ctaccccgct cctccacagc agctgtcctg atttattacc ttcaattaac20400ctccactcct ttctccatct cctgggatac cgcccctgtc ccagtggctg gtaaaggagc20460ttaggaagga ccagagccag gtgtggctag aggctaccag gcagggctgg ggatgaggag20520ctaaactgga agagtgtttg gttagtaggc acaaagcctt gggtgggatc cctagtaccg20580gagaagtgga gatgggcgct gagaagttca agaccatcca tccttaacta cacagccagt20640ttgaggccag cctgggctac ataaaaaccc aatctcaaaa gctgccaatt ctgattctgt20700gccacgtagt gcccgatgta atagtggatg aagtcgttga atcctggggc aacctatttt20760acagatgtgg ggaaaagcaa ctttaagtac cctgcccaca gatcacaaag aaagtaagtg20820acagagctcc agtgtttcat ccctgggttc caaggacagg gagagagaag ccagggtggg20880atctcactgc tccccggtgc ctccttccta taatccatac agattcgaaa gcgcagggca20940ggtttggaaa aagagagaag ggtggaagga gcagaccagt ctggcctagg ctgcagcccc21000tcacgcatcc ctctctccgc agatgtgtcc gagtacagct gccgcgagct gcactacacc21060cgcttcctga cagacggccc atgccgcagc gccaagccgg tcaccgagtt ggtgtgctcc21120ggccagtgcg gccccgcgcg gctgctgccc aacgccatcg ggcgcgtgaa gtggtggcgc21180ccgaacggac cggatttccg ctgcatcccg gatcgctacc gcgcgcagcg ggtgcagctg21240ctgtgccccg ggggcgcggc gccgcgctcg cgcaaggtgc gtctggtggc ctcgtgcaag21300tgcaagcgcc tcacccgctt ccacaaccag tcggagctca aggacttcgg gccggagacc21360gcgcggccgc agaagggtcg caagccgcgg cccggcgccc ggggagccaa agccaaccag21420gcggagctgg agaacgccta ctagagcgag cccgcgccta tgcagccccc gcgcgatccg21480attcgttttc agtgtaaagc ctgcagccca ggccaggggt gccaaacttt ccagaccgtg21540tggagttccc agcccagtag agaccgcagg tccttctgcc cgctgcgggg gatggggagg21600gggtggggtt cccgcgggcc aggagaggaa gcttgagtcc cagactctgc ctagccccgg21660gtgggatggg ggtctttcta ccctcgccgg acctatacag gacaaggcag tgtttccacc21720ttaaagggaa gggagtgtgg aacgaaagac ctgggactgg ttatggacgt acagtaagat21780ctactccttc cacccaaatg taaagcctgc gtgggctaga tagggtttct gaccctgacc21840tggccactga gtgtgatgtt gggctacgtg gttctctttt ggtacggtct tctttgtaaa21900atagggaccg gaactctgct gagattccaa ggattggggt accccgtgta gactggtgag21960agagaggaga acaggggagg ggttagggga gagattgtgg tgggcaaccg cctagaagaa22020gctgtttgtt ggctcccagc ctcgccgcct cagaggtttg gcttccccca ctccttcctc22080tcaaatctgc cttcaaatcc atatctggga tagggaaggc cagggtccga gagatggtgg22140
aagggccaga aatcacactc ctggcccccc gaagagcagt gtcccgcccc caactgcctt22200gtcatattgt aaagggattt tctacacaac agtttaaggt cgttggagga aactgggctt22260gccagtcacc tcccatcctt gtcccttgcc aggacaccac ctcctgcctg ccacccacgg22320acacatttct gtctagaaac agagcgtcgt cgtgctgtcc tctgagacag catatcttac22380attaaaaaga ataatacggg gggggggggc ggagggcgca agtgttatac atatgctgag22440aagctgtcag gcgccacagc accacccaca atctttttgt aaatcatttc cagacacctc22500ttactttctg tgtagatttt aattgttaaa aggggaggag agagagcgtt tgtaacagaa22560gcacatggag gggggggtag gggggttggg gctggtgagt ttggcgaact ttccatgtga22620gactcatcca caaagactga aagccgcgtt ttttttttta agagttcagt gacatattta22680ttttctcatt taagttattt atgccaacat ttttttcttg tagagaaagg cagtgttaat22740atcgctttgt gaagcacaag tgtgtgtggt tttttgtttt ttgttttttc cccgaccaga22800ggcattgtta ataaagacaa tgaatctcga gcaggaggct gtggtcttgt tttgtcaacc22860acacacaatg tctcgccact gtcatctcac tcccttccct tggtcacaag acccaaacct22920tgacaacacc tccgactgct ctctggtagc ccttgtggca atacgtgttt cctttgaaaa22980gtcacattca tcctttcctt tgcaaacctg gctctcattc cccagctggg tcatcgtcat23040accctcaccc cagcctccct ttagctgacc actctccaca ctgtcttcca aaagtgcacg23100tttcaccgag ccagttccct ggtccaggtc atcccattgc tcctccttgc tccagaccct23160tctcccacaa agatgttcat ctcccactcc atcaagcccc agtggccctg cggctatccc23220tgtctcttca gttagctgaa tctacttgct gacaccacat gaattccttc ccctgtctta23280aggttcatgg aactcttgcc tgcccctgaa ccttccagga ctgtcccagc gtctgatgtg23340tcctctctct tgtaaagccc caccccacta tttgattccc aattctagat cttcccttgt23400tcattccttc acgggatagt gtctcatctg gccaagtcct gcttgatatt gggataaatg23460caaagccaag tacaattgag gaccagttca tcattgggcc aagctttttc aaaatgtgaa23520ttttacacct atagaagtgt aaaagccttc caaagcagag gcaatgcctg gctcttcctt23580caacatcagg gctcctgctt tatgggtctg gtggggtagt acattcataa acccaacact23640aggggtgtga aagcaagatg attgggagtt cgaggccaat cttggctatg aggccctgtc23700tcaacctctc ctccctccct ccagggtttt gttttgtttt gtttttttga tttgaaactg23760caacacttta aatccagtca agtgcatctt tgcgtgaggg gaactctatc cctaatataa23820gcttccatct tgatttgtgt atgtgcacac tgggggttga acctgggcct ttgtacctgc23880cgggcaagct ctctactgct ctaaacccag ccctcactgg ctttctgttt caactcccaa23940tgaattcccc taaatgaatt atcaatatca tgtctttgaa aaataccatt gagtgctgct24000ggtgtccctg tggttccaga ttccaggaag gacttttcag ggaatccagg catcctgaag24060aatgtcttag agcaggaggc catggagacc ttggccagcc ccacaaggca gtgtggtgca24120gagggtgagg atggaggcag gcttgcaatt gaagctgaga oagggtactc aggattaaaa24180agcttccccc aaaacaattc caagatcagt tcctggtact tgcacctgtt cagctatgca24240gagcccagtg ggcataggtg aagacaccgg ttgtactgtc atgtactaac tgtgcttcag24300agccggcaga gacaaataat gttatggtga ccccagggga cagtgattcc agaaggaaca24360cagaagagag tgctgctaga ggctgcctga aggagaaggg gtcccagact ctctaagcaa24420agactccact cacataaaga cacaggctga gcagagctgg ccgtggatgc agggagccca24480tccaccatcc tttagcatgc ccttgtattc ccatcacatg ccagggatga ggggcatcag24540agagtccaag tgatgcccaa acccaaacac acctaggact tgctttctgg gacagacaga24600tgcaggagag actaggttgg gctgtgatcc cattaccaca aagagggaaa aaacaaaaaa24660caaacaaaca aacaaaaaaa aacaaaacaa aacaaaaaaa aacccaaggt ccaaattgta24720ggtcaggtta gagtttattt atggaaagtt atattctacc tccatggggt ctacaaggct24780ggcgcccatc agaaagaaca aacaacaggc tgatctggga ggggtggtac tctatggcag24840ggagcacgtg tgcttggggt acagccagac acggggcttg tattaatcac agggcttgta24900ttaataggct gagagtcaag cagacagaga gacagaagga aacacacaca cacacacaca24960cacacacaca cacacacaca catgcacaca ccactcactt ctcactcgaa gagcccctac25020ttacattcta agaacaaacc attcctcctc ataaaggaga caaagttgca gaaacccaaa25080agagccacag ggtccccact ctctttgaaa tgacttggac ttgttgcagg gaagacagag25140gggtctgcag aggcttcctg ggtgacccag agccacagac actgaaatct ggtgctgaga25200cctgtataaa ccctcttcca caggttccct gaaaggagcc cacattcccc aaccctgtct25260cctgaccact gaggatgaga gcacttgggc cttccccatt cttggagtgc accctggttt25320ccccatctga gggcacatga ggtctcaggt cttgggaaag ttccacaagt attgaaagtg25380ttcttgtttt gtttgtgatt taatttaggt gtatgagtgc ttttgcttga atatatgcct25440gtgtagcatt tacaagcctg gtgcctgagg agatcagaag atggcatcag ataccctgga25500actggacttg cagacagtta tgagccactg tgtgggtgct aggaacagaa cctggatcct25560
ccggaagagc agacagccag cgctcttagc cactaagcca tcactgaggt tctttctgtg25620gctaaagaga caggagacaa aggagagttt cttttagtca ataggaccat gaatgttcct25680cgtaacgtga gactagggca gggtgatccc ccagtgacac cgatggccct gtgtagttat25740tagcagctct agtcttattc cttaataagt cccagtttgg ggcaggagat atgtattccc25800tgctttgaag tggctgaggt ccagttatct acttccaagt acttgtttct ctttctggag25860ttggggaagc tccctgcctg cctgtaaatg tgtccattct tcaaccttag acaagatcac25920tttccctgag cagtcaggcc agtccaaagc ccttcaattt agctttcata aggaacaccc25980cttttgttgg gtggaggtag cacttgcctt gaatcccagc attaagaagg cagagacagt26040cggatctctg tgagttcaca gccagcctgg tctacggagt gagttccaag acagccaggc26100ctacacagag aaaccctgtc tcgaaaaaaa caaaaacaaa agaaataaag aaaaagaaaa26160caaaaacgaa caaacagaaa aacaagccag agtgtttgtc cccgtatttt attaatcata26220tttttgtccc tttgccattt tagactaaaa gactcgggaa agcaggtctc tctctgtttc26280tcatccggac acacccagaa ccagatgtat ggaagatggc taatgtgctg cagttgcaca26340tctggggctg ggtggattgg ttagatggca tgggctgggt gtggttacga tgactgcagg26400agcaaggagt atgtggtgca tagcaaacga ggaagtttgc acagaacaac actgtgtgta26460ctgatgtgca ggtatgggca catgcaagca gaagccaagg gacagcctta gggtagtgtt26520tccacagacc cctcccccct tttaacatgg gcatctctca ttggcctgga gcttgccaac26580tgggctgggc tggctagctt gtaggtccca gggatctgca tatctctgcc tccctagtgc26640tgggattaca gtcatatatg agcacacctg gcttttttat gtgggttctg ggctttgaac26700ccagatctga gtgcttgcaa ggcaatcggt tgaatgactg cttcatctcc ccagaccctg26760ggattctact ttctattaaa gtatttctat taaatcaatg agcccctgcc cctgcactca26820gcagttctta ggcctgctga gagtcaagtg gggagtgaga gcaagcctcg agaccccatc26880agcgaagcag aggacaaaga aatgaaaact tgggattcga ggctcgggat atggagatac26940agaaagggtc agggaaggaa atgaaccaga tgaatagagg caggaagggt agggccctgc27000atacatggaa cctggtgtac atgttatctg catggggttt gcattgcaat ggctcttcag27060caggttcacc acactgggaa acagaagcca aaaagaagag taggtggtgt tggagtcaga27120tactgtcagt catgcctgaa gaaatggaag caattaacga tgcgccgcaa ttaggatatt27180agctccctga agaaaggcaa gaagctgggc tgtgggcact gaagggagct ttgaatgatg27240tcacattctc tgtatgccta gcagggcagt attggagact gagacttgac ttgtgtgtcc27300atatgattcc tccttttcct acagtcatct ggggctcctg agcttcgtcc ttgtccaaga27360acctggagct ggcagtgggc agctgcagtg atagatgtct gcaagaaaga tctgaaaaga27420gggaggaaga tgaaggaccc agaggaccac cgacctctgc tgcctgacaa agctgcagga27480ccagtctctc ctacagatgg gagacagagg cgagagatga atggtcaggg gaggagtcag27540agaaaggaga gggtgaggca gagaccaaag gagggaaaca cttgtgctct acagctactg27600actgagtacc agctgcgtgg cagacagcca atgccaaggc tcggctgatc atggcacctc27660gtgggactcc tagcccagtg ctggcagagg ggagtgctga atggtgcatg gtttggatat27720gatctgaatg tggtccagcc ctagtttcct tccagttgct gggataaagc accctgacca27780aagctacttt tttgtttgtt tgttttggtt tggttttgtt tggtttttcg aggcagggtt27840tctctgtatc accctagctg tcctggaact cactctgtag accaggctgg cctcgaactc27900agaaatcccc ctgcctctgc ctcctaagtg ctggaattaa aggcctgcgc caccactgcc27960ggcccaaagc tactttaaga gagagagagg aatgtataag tattataatt ccaggttata28020gttcattgct gtagaattgg agtcttcata ttccaggtaa tctcccacag acatgccaca28080aaacaacctg ttctacgaaa tctctcatgg actcccttcc ccagtaattc taaactgtgt28140caaatctaca agaaatagtg acagtcacag tctctaacgt tttgggcatg agtctgaagt28200ctcattgcta agtactggga agatgaaaac tttacctagt gtcagcattt ggagcagagc28260ctttgggatt tgagatggtc ttttgcagag ctcctaatgg ctacatggag agagggggcc28320tgggagagac ccatacacct tttgctgcct tatgtcacct gacctgctcc ttgggaagct28380ctagcaagaa ggccttccct ggatcaccca ccaccttgca cctccagaac tcagagccaa28440attaaacttt cttgttactg tcgtcaaagc acagtcggtc tgggttgtat cactgtcaat28500gggaaacaga cttgcctgga tggataactt gtacattgca taatgtctag aaatgaaaag28560tcctatagag aaaaagaaaa ttagctggca cacagataga ggccctggag gaggctggct28620ttgtcctccc cgaggaggtg gcgagtaagg tgtaaatgtt catggatgta aatgggccca28680tatatgaggg tctggggtaa caagaaggcc tgtgaatata aagcactgaa ggtatgtcta28740gtctggagaa ggtcactaca gagagttctc caactcagtg cccatacaca cacacacaca28800cacacacaca cacacacaca cacacacaca ccacaaagaa aaaaaggaag aaaaatctga28860gagcaagtac agtacttaaa attgtgtgat tgtgtgtgtg actctgatgt cacatgctca28920tcttgcccta tgagttgaaa accaaatggc ccctgagagg cataacaacc acactgttgg28980
ctgtgtgctc acgtttttct taaagcgtct gtctggtttg ctgctagcat caggcagact29040tgcagcagac tacatatgct cagccctgaa gtccttctag ggtgcatgtc tcttcagaat29100ttcagaaagt catctgtggc tccaggaccg cctgcactct ccctctgccg cgaggctgca29160gactctaggc tggggtggaa gcaacgctta cctctgggac aagtataaca tgttggcttt29220tctttccctc tgtggctcca acctggacat aaaatagatg caagctgtgt aataaatatt29280tcctcccgtc cacttsgttc tcaacaataa ctactctgag agcacttatt aataggtggc29340ttagacataa gctttggctc attcccccac tagctcttac ttctttaact ctttcaaacc29400attctgtgtc ttccacatgg ttagttacct ctccttccat cctggttcgc ttcttccttc29460gagtcgccct cagtgtctct aggtgatgct tgtaagatat tctttctaca aagctgagag29520tggtggcact ctgggagttc aaagccagcc tgatctacac agcaagctcc aggatatcca29580gggcaatgtt gggaaaacct ttctcaaaca aaaagagggg ttcagttgtc aggaggagac29640ccatgggtta agaagtctag acgagccatg gtgatgcata cctttcatcc aagcacttag29700gaggcaaaga aaggtgaaac tctttgactt tgaggccagc taggttacat agtgataccc29760tgcttagtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtaatt taaaagtcta29820aaaatgcatt cttttaaaaa tatgtataag tatttgcctg cacatatgta tgtatgtatg29880tataccatgt gtgtgtctgg tgctgaagga ctaggcatag actccctaga actagagtca29940tagacagttg tgacactccc caacccccca ccatgtgggt gcttgaagct aaactcctgt30000cctttgtaaa gcagcaggtg tctatgaacc ctgaaccatc tctccagtct ccagatgtgc30060attctcaaag aggagtcctt catatttccc taaactgaac atccttatca gtgagcatcc30120tcgagtcacc aaagctactg caaaccctct tagggaacat tcactattca cttctacttg30180gctcatgaaa cttaagtaca cacacacaaa cacacacaca cacacagagt catgcactca30240caaaagcatg catgtacacc attcttatta gactatgctt tgctaaaaga ctttcctaga30300tactttaaaa catcacttct gccttttggt gggcaggttc caagattggt actggcgtac30360tggaaactga acaaggtaga gatctagaaa tcacagcagg tcagaagggc cagcctgtac30420aagagagagt tccacacctt ccaggaacac tgagcagggg gctgggacct tgcctctcag30480cccaagaaac tagtgcgttt cctgtatgca tgcctctcag agattccata agatctgcct30540tctgccataa gatctcctgc atccagacaa gcctagggga agttgagagg ctgcctgagt30600ctctcccaca ggccccttct tgcctggcag tattttttta tctggaggag aggaatcagg30660gtgggaatga tcaaatacaa ttatcaagga aaaagtaaaa aacatatata tatatatatt30720aactgatcta gggagctggc tcagcagtta agagttctgg ctgcccttgc ttcagatctt30780gctttgattc ccagcaccca catgatggct ttcaactgta tctctgcttc caggggatcc30840aacagcctct tctgacctcc atagacaaga cctagtcctc tgcaagagca ccaaatgctc30900ttatctgttg atccatctct ctagcctcat gccagatcat ttaaaactac tggacactgt30960cccattttac gaagatgtca ctgcccagtc atttgccatg agtggatatt tcgattcttt31020ctatgttctc acccttgcaa tttataagaa agatatctgc atttgtctcc tgagagaaca31080aagggtggag ggctactgag atggctctag gggtaaaggt gcttgccaca aaatctgaca31140acttaagttt ggtcttggaa tccacatggt ggagagagag aagagattcc cgtaagttgt31200cctcaaactt cccacacatg tgctgtggct tatgtgtaac cccaataagt aaagatagtt31260ttaaacacta cataaggtag ggtttcttca tgaccccaag gaatgatgcc cctgatagag31320cttatgctga aaccccatct ccattgtgcc atctggaaag agacaattgc atcccggaaa31380cagaatcttc atgaatggat taatgagcta ttaagaaagt ggcttggtta ttgcacatgc31440tggcggcgta atgacctcca ccatgatgtt atccagcatg aaggtcctca ccagaagtca31500tacaaatctt cttaggcttc cagagtcgtg agcaaaaaaa gcacacctct aaataaatta31560actagcctca ggtagttaac caccgaaaat gaaccaaggc agttctaata caaaaccact31620tcccttccct gttcaaacca cagtgcccta ttatctaaaa gataaacttc aagccaagct31680tttaggttgc cagtatttat gtaacaacaa ggcccgttga cacacatctg taactcctag31740tactgggcct caggggcaga gacaggtgga gccctggagt ttgaattcca ggttctgtga31800gaaactctgt ctgaaaagac aatatggtga gtgacccggg aggatatctg atattgactt31860ctggccaaca cacagccatc tctgcacatc tgtagttgca agccttttgc actaagtttg31920gccagagtca gagtttgcaa gtgtttgtgg actgaatgca cgtgttgctg gtgatctaca31980aagtcaccct ccttctcaag ctagcagcac tggcttcggc cagctgctca ttcaagcctc32040tttgcagagt catcacgggg atgggggagc agggcccctc cctagaacac caagcctgtg32100gttgtttatt caggacatta ttgagggcca agatgacaga taactctatc acttggccaa32160cagtcgggtg ttgcggtgtt aggttatttc tgtgtctgca gaaaacagtg caacctggac32220aaaagaaata aatgatatca tttttcattc aggcaactag attccgtggt acaaaaggct32280ccctggggaa cgaggccggg acagcgcggc tcctgagtcg ctatttccgt ctgtcaactt32340ctctaatctc ttgatttcct ccctctgtct gtttccttcc tcttgctggg gcccagtgga32400
gtctgtgtac tcacagggag gagggtggca aagccctggt cctctacggg ctgggggaag32460gggggaagct gtcggcccag tgactttttc ccctttctct ttttcttaga aaccagtctc32520aatttaagat aatgagtctc ctcattcacg tgtgctcact attcataggg acttatccac32580ccccgccctg tcaatctggc taagtaagac aagtcaaatt taaaagggaa cgtttttcta32640aaaatgtggc tggaccgtgt gccggcacga aaccagggat ggcggtctaa gttacatgct32700ctctgccagc cccggtgcct tttcctttcg gaaaggagac ccggaggtaa aacgaagttg32760ccaacttttg atgatggtgt gcgccgggtg actctttaaa atgtcatcca tacctgggat32820agggaaggct cttcagggag tcatctagcc ctcccttcag gaaaagattc cacttccggt32880ttagttagct tccacctggt cccttatccg ctgtctctgc ccactagtcc tcatccatcc32940ggtttccgcc ctcatccacc ttgccctttt agttcctaga aagcagcacc gtagtcttgg33000caggtgggcc attggtcact ccgctaccac tgttaccatg gccaccaagg tgtcatttaa33060atatgagctc actgagtcct gcgggatggc ttggttggta atatgcttgc tgcaaaatcg33120tgagaactgg agttcaattc ccagcacatg gatgtatttc cagcacctgg aaggcaggga33180gcagagatct taaagctcct ggccagacag cccagcctaa ttagtaatca gtgagagacc33240ctgtctcaag aaacaagatg gaacatcaaa ggtcaacctc ttgtctccac acacacaaat33300acacacatgc acatacatcc acacacaggc aaacacatgc acacacctga acaccctcca33360caaatacata cataaaaaaa taaatacata cacacataca tacatacacc aacattccct33420ctccttagtc tcctggctac gctcttgtca cccccactaa ggcttcaact tcttctattt33480cttcatcttg actcctctgt actttgcatg ccttttccag caaaggcttt tctttaaatc33540tccgtcattc ataaactccc tctaaatttc ttcccctgcc cttttctttc tctctaggga33600gataaagaca cacactacaa agtcaccgtg ggaccagttt attcacccac ccacccctgc33660ttctgttcat ccggccagct aagtagtcca acctctctgg tgctgtaccc tggaccctgg33720cttcaccaca gctcctccat gctacccagc cctgcaaacc ttcagcctag cctctggttc33780tccaaccagc acaggcccag tctggcttct atgtcctaga aatctccttc attctctcca33840tttccctcct gaatctacca ccttctttct cccttctcct gacctctaat gtcttggtca33900aacgattaca aggaagccaa tgaaattagc agtttggggt acctcagagt cagcagggga33960gctgggatga attcacattt ccaggccttt gctttgctcc ccggattctg acaggcagtt34020ccgaagctga gtccaggaag ctgaatttaa aatcacactc cagctgggtt ctgaggcagc34080cctaccacat cagctggccc tgactgagct gtgtctgggt ggcagtggtg ctggtggtgc34140tggtggtgct ggtggtggtg gtggtggtgg tggtggtggt ggtggtggtg tgtgtgtgtg34200ttttctgctt ttacaaaact tttctaattc ttatacaaag gacaaatctg cctcatatag34260gcagaaagat gacttatgcc tatataagat ataaagatga ctttatgcca cttattagca34320atagttactg tcaaaagtaa ttctatttat acacccttat acatggtatt gcttttgttg34380gagactctaa aatccagatt atgtatttaa aaaaaaattc cccagtcctt aaaaggtgaa34440gaatggaccc agatagaagg tcacggcaca agtatggagt cggagtgtgg agtcctgcca34500atggtctgga cagaagcatc cagagagggt ccaagacaaa tgcctcgcct cctaaggaac34560actggcagcc ctgatgaggt accagagatt gctaagtgga ggaatacagg atcagaccca34620tggaggggct taaagcgtga ctgtagcagc cctccgctga ggggctccag gtgggcgccc34680aaggtgctgc agtgggagcc acatgagagg tgatgtcttg gagtcacctc gggtaccatt34740gtttagggag gtggggattt gtggtgtgga gacaggcagc ctcaaggatg cttttcaaca34800atggttgatg agttggaact aaaacagggg ccatcacact ggctcccata gctctgggct34860tgccagcttc cacatctgcc ccccaccccc tgtctggcac cagctcaagc tctgtgattc34920tacacatcca aaagaggaag agtagcctac tgggcatgcc acctcttctg gaccatcagg34980tgagagtgtg gcaagcccta ggctcctgtc caggatgcag ggctgccaga taggatgctc35040agctatctcc tgagctggaa ctattttagg aataaggatt atgcccgccc ggggttggcc35100agcaccccag cagcctgtgc ttgcgtaaaa gcaagtgctg ttgatttatc taaaaacaga35160gccgtggacc cacccacagg acaagtatgt atgcatctgt ttcatgtatc tgaaaagcga35220cacaaccatt tttcacatca tggcatcttc ctaaccccca ttcttttttg ttttgttttt35280ttgagacagg gtttctctgt gtagtcctgg ctgtcctgga actcactttg tagaccaggc35340tggcctcgaa ctcagaaatc ctgggattaa aggtgtgtgc caccacgccc ggccctaacc35400cccattctta atggtgatcc agtggttgaa atttcgggcc acacacatgt ccattaggga35460ttagctgctg tcttctgagc tacctggtac aatctttatc ccctggggcc tgggctcctg35520atccctgact cgggcccgat caagtccagt tcctgggccc gatcaagtcc agttcctggg35580cccgaacaag tccagtccct agctcgatta gctcatcctg gctccctggc ctgttcttac35640ttacactctt ccccttgctc tggacttgtt gctttcttta ctcaagttgt ctgccacagt35700ccctaagcca cctctgtaag acaactaaga taatacttcc ctcaagcacg gaaagtcctg35760agtcaccaca ccctctggag gtgtgtggac acatgttcat gcgtgtggtt gcgcttacgt35820
acgtgtg 35828<210>18<211>9301<212>DNA<213>Homo sapien<400>18tagaggagaa gtctttgggg agggtttgct ctgagcacac ccctttccct ccctccgggg60ctgagggaaa catgggacca gccctgcccc agcctgtcct cattggctgg catgaagcag120agaggggctt taaaaaggcg accgtgtctc ggctggagac cagagcctgt gctactggaa180ggtggcgtgc cctcctctgg ctggtaccat gcagctccca ctggccctgt gtctcgtctg240cctgctggta cacacagcct tccgtgtagt ggagggccag gggtggcagg cgttcaagaa300tgatgccacg gaaatcatcc ccgagctcgg agagtacccc gagcctccac cggagctgga360gaacaacaag accatgaacc gggcggagaa cggagggcgg cctccccacc acccctttga420gaccaaaggt atggggtgga ggagagaatt cttagtaaaa gatcctgggg aggttttaga480aacttctctt tgggaggctt ggaagactgg ggtagaccca gtgaagattg ctggcctctg540ccagcactgg tcgaggaaca gtcttgcctg gaggtggggg aagaatggct cgctggtgca600gccttcaaat tcaggtgcag aggcatgagg caacagacgc tggtgagagc ccagggcagg660gaggacgctg gggtggtgag ggtatggcat cagggcatca gaacaggctc aggggctcag720aaaagaaaag gtttcaaaga atctcctcct gggaatatag gagccacgtc cagctgctgg780taccactggg aagggaacaa ggtaagggag cctcccatcc acagaacagc acctgtgggg840caccggacac tctatgctgg tggtggctgt ccccaccaca cagacccaca tcatggaatc900cccaggaggt gaacccccag ctcgaagggg aagaaacagg ttccaggcac tcagtaactt960ggtagtgaga agagctgagg tgtgaacctg gtttgatcca actgcaagat agccctggtg1020tgtggggggg tgtgggggac agatctccac aaagcagtgg ggaggaaggc cagagaggca1080cccctgcagt gtgcattgcc catggcctgc ccagggagct ggcacttgaa ggaatgggag1140ttttcggcac agttttagcc cctgacatgg gtgcagctga gtccaggccc tggaggggag1200agcagcatcc tctgtgcagg agtagggaca tctgtcctca gcagccaccc cagtcccaac1260cttgcctcat tccaggggag ggagaaggaa gaggaaccct gggttcctgg tcaggcctgc1320acagagaagc ccaggtgaca gtgtgcatct ggctctataa ttggcaggaa tcctgaggcc1380atgggggcgt ctgaaatgac acttcagact aagagcttcc ctgtcctctg gccattatcc1440aggtggcaga gaagtccact gcccaggctc ctggacccca gccctccccg cctcacaacc1500tgttgggact atggggtgct aaaaagggca actgcatggg aggccagcca ggaccctccg1560tcttcaaaat ggaggacaag ggcgcctccc cccacagctc cccttctagg caaggtcagc1620tgggctccag cgactgcctg aagggctgta aggaacccaa acacaaaatg tccaccttgc1680tggactccca cgagaggcca cagcccctga ggaagccaca tgctcaaaac aaagtcatga1740tctgcagagg aagtgcctgg cctaggggcg ctattctcga aaagccgcaa aatgccccct1800tccctgggca aatgcccccc tgaccacaca cacattccag ccctgcagag gtgaggatgc1860aaaccagccc acagaccaga aagcagcccc agacgatggc agtggccaca tctcccctgc1920tgtgcttgct cttcagagtg ggggtggggg gtggccttct ctgtcccctc tctggtttgg1980tcttaagact atttttcatt ctttcttgtc acattggaac tatccccatg aaacctttgg2040gggtggactg gtactcacac gacgaccagc tatttaaaaa gctcccaccc atctaagtcc2100accataggag acatggtcaa ggtgtgtgca ggggatcagg ccaggcctcg gagcccaatc2160tctgcctgcc cagggagtat caccatgagg cgcccattca gataacacag aacaagaaat2220gtgcccagca gagagccagg tcaatgtttg tggcagctga acctgtaggt tttgggtcag2280agctcagggc ccctatggta ggaaagtaac gacagtaaaa agcagccctc agctccatcc2340cccagcccag cctcccatgg atgctcgaac gcagagcctc cactcttgcc ggagccaaaa2400ggtgctggga ccccagggaa gtggagtccg gagatgcagc ccagcctttt gggcaagttc2460ttttctctgg ctgggcctca gtattctcat tgataatgag ggggttggac acactgcctt2520tgattccttt caagtctaat gaattcctgt cctgatcacc tccccttcag tccctcgcct2580ccacagcagc tgccctgatt tattaccttc aattaacctc tactcctttc tccatcccct2640gtccacccct cccaagtggc tggaaaagga atttgggaga agccagagcc aggcagaagg2700tgtgctgagt acttaccctg cccaggccag ggaccctgcg gcacaagtgt ggcttaaatc2760ataagaagac cccagaagag aaatgataat aataatacat aacagccgac gctttcagct2820atatgtgcca aatggtattt tctgcattgc gtgtgtaatg gattaactcg caatgcttgg2880ggcggcccat tttgcagaca ggaagaagag agaggttaag gaacttgccc aagatgacac2940
ctgcagtgag cgatggagcc ctggtgtttg aaccccagca gtcatttggc tccgagggga3000cagggtgcgc aggagagctt tccaccagct ctagagcatc tgggaccttc ctgcaataga3060tgttcagggg caaaagcctc tggagacagg cttggcaaaa gcagggctgg ggtggagaga3120gacgggccgg tccagggcag gggtggccag gcgggcggcc accctcacgc gcgcctctct3180ccacagacgt gtccgagtac agctgccgcg agctgcactt cacccgctac gtgaccgatg3240ggccgtgccg cagcgccaag ccggtcaccg agctggtgtg ctccggccag tgcggcccgg3300cgcgcctgct gcccaacgcc atcggccgcg gcaagtggtg gcgacctagt gggcccgact3360tccgctgcat ccccgaccgc taccgcgcgc agcgcgtgca gctgctgtgt cccggtggtg3420aggcgccgcg cgcgcgcaag gtgcgcctgg tggcctcgtg caagtgcaag cgcctcaccc3480gcttccacaa ccagtcggag ctcaaggact tcgggaccga ggccgctcgg ccgcagaagg3540gccggaagcc gcggccccgc gcccggagcg ccaaagccaa ccaggccgag ctggagaacg3600cctactagag cccgcccgcg cccctcccca ccggcgggcg ccccggccct gaacccgcgc3660cccacatttc tgtcctctgc gcgtggtttg attgtttata tttcattgta aatgcctgca3720acccagggca gggggctgag accttccagg ccctgaggaa tcccgggcgc cggcaaggcc3780cccctcagcc cgccagctga ggggtcccac ggggcagggg agggaattga gagtcacaga3840cactgagcca cgcagccccg cctctggggc cgcctacctt tgctggtccc acttcagagg3900aggcagaaat ggaagcattt tcaccgccct ggggttttaa gggagcggtg tgggagtggg3960aaagtccagg gactggttaa gaaagttgga taagattccc ccttgcacct cgctgcccat4020cagaaagcct gaggcgtgcc cagagcacaa gactgggggc aactgtagat gtggtttcta4080gtcctggctc tgccactaac ttgctgtgta accttgaact acacaattct ccttcgggac4140ctcaatttcc actttgtaaa atgagggtgg aggtgggaat aggatctcga ggagactatt4200ggcatatgat tccaaggact ccagtgcctt ttgaatgggc agaggtgaga gagagagaga4260gaaagagaga gaatgaatgc agttgcattg attcagtgcc aaggtcactt ccagaattca4320gagttgtgat gctctcttct gacagccaaa gatgaaaaac aaacagaaaa aaaaaagtaa4380agagtctatt tatggctgac atatttacgg ctgacaaact cctggaagaa gctatgctgc4440ttcccagcct ggcttccccg gatgtttggc tacctccacc cctccatctc aaagaaataa4500catcatccat tggggtagaa aaggagaggg tccgagggtg gtgggaggga tagaaatcac4560atccgcccca acttcccaaa gagcagcatc cctcccccga cccatagcca tgttttaaag4620tcaccttccg aagagaagtg aaaggttcaa ggacactggc cttgcaggcc cgagggagca4680gccatcacaa actcacagac cagcacatcc cttttgagac accgccttct gcccaccact4740cacggacaca tttctgccta gaaaacagct tcttactgct cttacatgtg atggcatatc4800ttacactaaa agaatattat tgggggaaaa actacaagtg ctgtacatat gctgagaaac4860tgcagagcat aatagctgcc acccaaaaat ctttttgaaa atcatttcca gacaacctct4920tactttctgt gtagttttta attgttaaaa aaaaaaagtt ttaaacagaa cacatgaca 4980tatgaaagcc tgcaggactg gtcgtttttt tggcaattct tccacgtggg acttgtccac5040aagaatgaaa gtagtggttt ttaaagagtt aagttacata tttattttct cacttaagtt5100atttatgcaa aagtttttct tgtagagaat gacaatgtta atattgcttt atgaattaac5160agtctgttct tccagagtcc agagacattg ttaataaaga caatgaatca tgaccgaaag5220gatgtggtct cattttgtca accacacatg acgtcatttc tgtcaaagtt gacacccttc5280tcttggtcac tagagctcca accttggaca cacctttgac tgctctctgg tggcccttgt5340ggcaattatg tcttcctttg aaaagtcatg tttatccctt cctttccaaa cccagaccgc5400atttcttcac ccagggcatg gtaataacct cagccttgta tccttttagc agcctcccct5460ccatgctggc ttccaaaatg ctgttctcat tctatcactc ccctgctcaa aagccttcca5520tagctccccc ttgcccagga tcaagtgcag tttccctatc tgacatggga ggccttctct5580gcttgactcc cacctcccac tccaccaagc ttcctactga ctccaaatgg tcatgcagat5640ccctgcttcc ttagtttgcc atccacactt agcaccccca ataactaatc ctctttcttt5700aggattcaca ttacttgtca tctcttcccc taaccttcca gagatgttcc aatctcccat5760gatccctctc tcctctgagg ttccagcccc ttttgtctac accactactt tggttcctaa5820ttctgttttc catttgacag tcattcatgg aggaccagcc tggccaagtc ctgcttagta5880ctggcataga caacacaaag ccaagtacaa ttcaggacca gctcacagga aacttcatct5940tcttcgaagt gtggatttga tgcctcctgg gtagaaatgt aggatcttca aaagtgggcc6000agcctcctgc acttctctca aagtctcgcc tccccaaggt gtcttaatag tgctggatgc6060tagctgagtt agcatcttca gatgaagagt aaccctaaag ttactcttca gttgccctaa6120ggtgggatgg tcaactggaa agctttaaat taagtccagc ctaccttggg ggaacccacc6180cccacaaaga aagctgaggt ccctcctgat gacttgtcag tttaactacc aataacccac6240ttgaattaat catcatcatc aagtctttga taggtgtgag tgggtatcag tggccggtcc6300cttcctgggg ctccagcccc cgaggaggcc tcagtgagcc cctgcagaaa atccatgcat6360
catgagtgtc tcagggccca gaatatgaga gcaggtagga aacagagaca tcttccatcc6420ctgagaggca gtgcggtcca gtgggtgggg acacgggctc tgggtcaggt ttgtgttgtt6480tgtttgtttg ttttgagaca gagtctcgct ctattgccca ggctggagtg cagtgtcaca6540atctcggctt actgcaactt ctgccttccc ggattcaagt gattctcctg cctcagcctc6600cagagtagct gggattacag gtgcgtgcca ccacgcctgg ctaatttttg tatttttgat6660agagacgggg tttcaccatg ttggccaggc tagtctcgaa ctcttgacct caagtgatct6720gcctgcctcg gcctcccaaa gtgctgggat tacaggcgtg agccaccaca cccagcccca6780ggttggtgtt tgaatctgag gagactgaag caccaagggg ttaaatgttt tgcccacagc6840catacttggg ctcagttcct tgccctaccc ctcacttgag ctgcttagaa cctggtgggc6900acatgggcaa taaccaggtc acactgtttt gtaccaagtg ttatgggaat ccaagatagg6960agtaatttgc tctgtggagg ggatgaggga tagtggttag ggaaagcttc acaaagtggg7020tgttgcttag agattttcca ggtggagaag ggggcttcta ggcagaaggc atagcccaag7080caaagactgc aagtgcatgg ctgctcatgg gtagaagaga atccaccatt cctcaacatg7140taccgagtcc ttgccatgtg caaggcaaca tgggggtacc aggaattcca agcaatgtcc7200aaacctaggg tctgctttct gggacctgaa gatacaggat ggatcagccc aggctgcaat7260cccattacca cgagggggaa aaaaacctga aggctaaatt gtaggtcggg ttagaggtta7320tttatggaaa gttatattct acctacatgg ggtctataag cctggcgcca atcagaaaag7380gaacaaacaa cagacctagc tgggaggggc agcattttgt tgtagggggc ggggcacatg7440ttctgggggt acagccagac tcagggcttg tattaatagt ctgagagtaa gacagacaga7500gggatagaag gaaataggtc cctttctctc tctctctctc tctctctctc actctctctc7560tctctcacac acacacacag acacacacac acgctctgta ggggtctact tatgctccaa7620gtacaaatca ggccacattt acacaaggag gtaaaggaaa agaacgttgg aggagccaca7680ggaccccaaa attccctgtt ttccttgaat caggcaggac ttacgcagct gggagggtgg7740agagcctgca gaagccacct gcgagtaagc caagttcaga gtcacagaca ccaaaagctg7800gtgccatgtc ccacacccgc ccacctccca cctgctcctt gacacagccc tgtgctccac7860aacccggctc ccagatcatt gattatagct ctggggcctg caccgtcctt cctgccacat7920ccccacccca ttcttggaac ctgccctctg tcttctccct tgtccaaggg caggcaaggg7980ctcagctatt gggcagcttt gaccaacagc tgaggctcct tttgtggctg gagatgcagg8040aggcagggga atattcctct tagtcaatgc gaccatgtgc ctggtttgcc cagggtggtc8100tcgtttacac ctgtaggcca agcgtaatta ttaacagctc ccacttctac tctaaaaaat8160gacccaatct gggcagtaaa ttatatggtg cccatgctat taagagctgc aacttgctgg8220gcgtggtggc tcacacctgt aatcccagta ctttgggacg tcaaggcggg tggatcacct8280gaggtcacga gttagagact ggcctggcca gcatggcaaa accccatctt tactaaaaat8340acaaaaacta gcaaggcatg gtggcatgca cctgtaatcc caggtactcg ggaggctgag8400acaggagaat ggcttgaacc caggaggcag aggttgcagt gagccaagat tgtgccactg8460ccctccagcc ctggcaacag agcaagactt catctcaaaa gaaaaaggat actgtcaatc8520actgcaggaa gaacccaggt aatgaatgag gagaagagag gggctgagtc accatagtgg8580cagcaccgac tcctgcagga aaggcgagac actgggtcat gggtactgaa gggtgccctg8640aatgacgttc tgctttagag accgaacctg agccctgaaa gtgcatgcct gttcatgggt8700gagagactaa attcatcatt ccttggcagg tactgaatcc tttcttacgg ctgccctcca8760atgcccaatt tccctacaat tgtctggggt gcctaagctt ctgcccacca agagggccag8820agctggcagc gagcagctgc aggtaggaga gataggtacc cataagggag gtgggaaaga8880gagatggaag gagaggggtg cagagcacac acctcccctg cctgacaact tcctgagggc8940tggtcatgcc agcagattta aggcggaggc aggggagatg gggcgggaga ggaagtgaaa9000aaggagaggg tggggatgga gaggaagaga gggtgatcat tcattcattc cattgctact9060gactggatgc cagctgtgag ccaggcacca ccctagctct gggcatgtgg ttgtaatctt9120ggagcctcat ggagctcaca gggagtgctg gcaaggagat ggataatgga cggataacaa9180ataaacattt agtacaatgt ccgggaatgg aaagttctcg aaagaaaaat aaagctggtg9240agcatataga cagccctgaa ggcggccagg ccaggcattt ctgaggaggt ggcatttgag9300c9301<210>19<211>21<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>19ccggagctgg agaacaacaa g 21<210>20<211>19<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>20gcactggccg gagcacacc 19<210>21<211>23<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>21aggccaaccg cgagaagatg acc 23<210>22<211>21<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>22gaagtccagg gcgacgtagc a 21<210>23<211>25<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>23aagcttggta ccatgcagct cccac 25<210>24<211>50<212>DNA<213>人工序列<220>
<223>用于PCR的引物
<400>24aagcttctac ttgtcatcgt cgtccttgta gtcgtaggcg ttctccagct50<210>25<211>19<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>25gcactggccg gagcacacc 19<210>26<211>39<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>26gtcgtcggat ccatggggtg gcaggcgttc aagaatgat39<210>27<211>57<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>27gtcgtcaagc ttctacttgt catcgtcctt gtagtcgtag gcgttctcca gctcggc57<210>28<211>29<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>28gacttggatc ccaggggtgg caggcgttc 29<210>29<211>29<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>29agcataagct tctagtaggc gttctccag 29
<210>30<211>29<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>30gacttggatc cgaagggaaa aagaaaggg 29<210>31<211>29<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>31agcataagct tttaatccaa atcgatgga 29<210>32<211>33<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>32actacgagct cggccccacc acccatcaac aag 33<210>33<211>34<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>33acttagaagc tttcagtcct cagccccctc ttcc 34<210>34<211>66<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>34aatctggatc cataacttcg tatagcatac attatacgaa gttatctgca ggattcgagg 60gcccct66
<210>35<211>82<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>35aatctgaatt ccaccggtgt taattaaata acttcgtata atgtatgcta tacgaagtta60tagatctaga gtcagcttct ga 82<210>36<211>62<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>36atttaggtga cactatagaa ctcgagcagc tgaagcttaa ccacatggtg gctcacaacc60at 62<210>37<211>54<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>37aacgacggcc agtgaatccg taatcatggt catgctgcca ggtggaggag ggca 54<210>38<211>31<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>38attaccaccg gtgacacccg cttcctgaca g 31<210>39<211>61<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>39attacttaat taaacatggc gcgccatatg gccggcccct aattgcggcg catcgttaat60t61
<210>40<211>34<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>40attacggccg gccgcaaagg aattcaagat ctga 34<210>41<211>34<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>41attacggcgc gcccctcaca ggccgcaccc agct 34<210>42<211>184<212>PRT<213>Homo sapiens<400>42Met Ser Arg Thr Ala Tyr Thr Val Gly Ala Leu Leu Leu Leu Leu Gly1 5 10 15Thr Leu Leu Pro Ala Ala Glu Gly Lys Lys Lys Gly Ser Gln Gly Ala20 25 30Ile Pro Pro Pro Asp Lys Ala Gln His Asn Asp Ser Glu Gln Thr Gln35 40 45Ser Pro Gln Gln Pro Gly Ser Arg Asn Arg Gly Arg Gly Gln Gly Arg50 55 60Gly Thr Ala Met Pro Gly Glu Glu Val Leu Glu Ser Ser Gln Glu Ala65 70 75 80Leu His Val Thr Glu Arg Lys Tyr Leu Lys Arg Asp Trp Cys Lys Thr85 90 95Gln Pro Leu Lys Gln Thr Ile His Glu Glu Gly Cys Asn Ser Arg Thr100 105 110Ile Ile Asn Arg Phe Cys Tyr Gly Gln Cys Asn Ser Phe Tyr Ile Pro115 120 125Arg His Ile Arg Lys Glu Glu Gly Ser Phe Gln Ser Cys Ser Phe Cys130 135 140Lys Pro Lys Lys Phe Thr Thr Met Met Val Thr Leu Asn Cys Pro Glu145 150 155 160Leu Gln Pro Pro Thr Lys Lys Lys Arg Val Thr Arg Val Lys Gln Cys165 170 175Arg Cys Ile Ser Ile Asp Leu Asp180<210>43<211>267
<212>PRT<213>Homo sapiens<400>43Met His Leu Leu Leu Phe Gln Leu Leu Val Leu Leu Pro Leu Gly Lys1 5 10 15Thr Thr Arg His Gln Asp Gly Arg Gln Asn Gln Ser Ser Leu Ser Pro20 25 30Val Leu Leu Pro Arg Asn Gln Arg Glu Leu Pro Thr Gly Asn His Glu35 40 45Glu Ala Glu Glu Lys Pro Asp Leu Phe Val Ala Val Pro His Leu Val50 55 60Ala Thr Ser Pro Ala Gly Glu Gly Gln Arg Gln Arg Glu Lys Met Leu65 70 75 80Ser Arg Phe Gly Arg Phe Trp Lys Lys Pro Glu Arg Glu Met His Pro85 90 95Ser Arg Asp Ser Asp Ser Glu Pro Phe Pro Pro Gly Thr Gln Ser Leu100 105 110Ile Gln Pro Ile Asp Gly Met Lys Met Glu Lys Ser Pro Leu Arg Glu115 120 125Glu Ala Lys Lys Phe Trp His His Phe Met Phe Arg Lys Thr Pro Ala130 135 140Ser Gln Gly Val Ile Leu Pro Ile Lys Ser His Glu Val His Trp Glu145 150 155 160Thr Cys Arg Thr Val Pro Phe Ser Gln Thr Ile Thr His Glu Gly Cys165 170 175Glu Lys Val Val Val Gln Asn Asn Leu Cys Phe Gly Lys Cys Gly Ser180 185 190Val His Phe Pro Gly Ala Ala Gln His Ser His Thr Ser Cys Ser His195 200 205Cys Leu Pro Ala Lys Phe Thr Thr Met His Leu Pro Leu Asn Cys Thr210 215 220Glu Leu Ser Ser Val Ile Lys Val Val Met Leu Val Glu Glu Cys Gln225 230 235 240Cys Lys Val Lys Thr Glu His Glu Asp Gly His Ile Leu His Ala Gly245 250 255Ser Gln Asp Ser Phe Ile Pro Gly Val Ser Ala260 265<210>44<211>180<212>PRT<213>Homo sapiens<400>44Met Leu Arg Val Leu Val Gly Ala Val Leu Pro Ala Met Leu Leu Ala1 5 10 15Ala Pro Pro Pro Ile Asn Lys Leu Ala Leu Phe Pro Asp Lys Ser Ala20 25 30Trp Cys Glu Ala Lys Asn Ile Thr Gln Ile Val Gly His Ser Gly Cys35 40 45Glu Ala Lys Ser Ile Gln Asn Arg Ala Cys Leu Gly Gln Cys Phe Ser50 55 60Tvr Ser Val Pro Asn Thr Phe Pro Gln Ser Thr Glu Ser Leu Val His65 70 75 80Cys Asp Ser Cys Met Pro Ala Gln Ser Met Trp Glu Ile Val Thr Leu85 90 95
Glu Cys Pro Gly His Glu Glu Val Pro Arg Val Asp Lys Leu Val Glu100 105 110Lys Ile Leu His Cys Ser Cys Gln Ala Cys Gly Lys Glu Pro Ser His115 120 125Glu Gly Leu Ser Val Tyr Val Gln Gly Glu Asp Gly Pro Gly Ser Gln130 135 140Pro Gly Thr His Pro His Pro His Pro His Pro His Pro Gly Gly Gln145 150 155 160Thr Pro Glu Pro Glu Asp Pro Pro Gly Ala Pro His Thr Glu Glu Glu165 170 175Gly Ala Glu Asp180<210>45<211>642<212>DNA<213>Homo sapiens<220>
<221>CDS<222>(1)..(639)<400>45atg cag ctc cca ctg gcc ctg tgt ctc gtc tgc ctg ctg gta cac aca48Met Gln Leu Pro Leu Ala Leu Cys Leu Val Cys Leu Leu Val His Thr1 5 10 15gcc ttc cgt gta gtg gag ggc cag ggg tgg cag gcg ttc aag aat gat96Ala Phe Arg Val Val Glu Gly Gln Gly Trp Gln Ala Phe Lys Asn Asp20 25 30gcc acg gaa atc atc ccc gag ctc gga gag tac ccc gag cct cca ccg144Ala Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro35 40 45gag ctg gag aac aac aag acc atg aac cgg gcg gag aac gga ggg cgg192Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg50 55 60cct ccc cac cac ccc ttt gag acc aaa gac gtg tcc gag tac agc tgc240Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser Cys65 70 75 80ogc gag ctg cac ttc acc cgc tac gtg acc gat ggg ccg tgc cgc agc288Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg Ser85 90 95gcc aag ccg gtc acc gag ctg gtg tgc tcc ggc cag tgc ggc ccg gcg336Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala100 105 110cgc ctg ctg ccc aac gcc atc ggc cgc ggc aag tgg tgg cga cct agt384Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser115 120 125ggg ccc gac ttc cgc tgc atc ccc gac cgc tac cgc gcg cag cgc gtg432Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val
130 135 140cag ctg ctg tgt ccc ggt ggt gag gcg ccg cgc gcg cgc aag gtg cgc480Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg145 150 155 160ctg gtg gcc tcg tgc aag tgc aag cgc ctc acc cgc ttc cac aac cag528Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln165 170 175tcg gag ctc aag gac ttc ggg acc gag gcc gct cgg ccg cag aag ggc576Ser Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly180 185 190cgg aag ccg cgg ccc cgc gcc cgg agc gcc aaa gcc aac cag gcc gag624Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu195 200 205ctg gag aac gcc tac tag642Leu Glu Asn Ala Tyr210<210>46<211>190<212>PRT<213>Homo sapiens<400>46Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro Glu1 5 10 15Leu Gly Glu Tyr Pro Glu Pro Pro Pro Glu Leu Glu Asn Asn Lys Thr20 25 30Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro His His Pro Phe Glu35 40 45Thr Lys Asp Val Ser Glu Tyr Ser Cys Arg Glu Leu His Phe Thr Arg50 55 60Tyr Val Thr Asp Gly Pro Cys Arg Ser Ala Lys Pro Val Thr Glu Leu65 70 75 80Val Cys Ser Gly Gln Cys Gly Pro Ala Arg Leu Leu Pro Asn Ala Ile85 90 95Gly Arg Gly Lys Trp Trp Arg Pro Ser Gly Pro Asp Phe Arg Cys Ile100 105 110Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro Gly Gly115 120 125Glu Ala Pro Arg Ala Arg Lys Val Arg Leu Val Ala Ser Cys Lys Cys130 135 140Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly145 150 155 160Thr Glu Ala Ala Arg Pro Gln Lys Gly Arg Lys Pro Arg Pro Arg Ala165 170 175Arg Ser Ala Lys Ala Asn Gln Ala Glu Leu Glu Asn Ala Tyr180 185 190<210>47<211>20<212>PRT
<213>Homo sapiens<400>47Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro Glu1 5 10 15Leu Gly Glu Tyr20<210>48<211>20<212>PRT<213>Homo sapiens<400>48Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro Glu1 5 10 15Leu Glu Asn Asn20<210>49<211>20<212>PRT<213>Homo sapiens<400>49Pro Glu Pro Pro Pro Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala1 5 10 15Glu Asn Gly Gly20<210>50<211>20<212>PRT<213>Homo sapiens<400>50Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro His His Pro1 5 10 15Phe Glu Thr Lys20<210>51<211>16<212>PRT<213>Homo sapiens<400>51Arg Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser1 5 10 15<210>52<211>21
<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的人SOST肽片段<400>52Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro Glu1 5 10 15Leu Gly Glu Tyr Cys20<210>53<211>21<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的人SOST肽片段<400>53Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro Glu1 5 10 15Leu Glu Asn Asn Cys20<210>54<211>21<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的人SOST肽片段<400>54Pro Glu Pro Pro Pro Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala1 5 10 15Glu Asn Gly Gly Cys20<210>55<211>21<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的人SOST肽片段<400>55Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro His His Pro
341 5 10 15Phe Glu Thr Lys Cys20<210>56<211>17<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的人SOST肽片段<400>56Arg Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser1 5 10 15Cys<210>57<211>24<212>PRT<213>Rattus norvegicus<400>57Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro Gly1 5 10 15Leu Arg Glu Tyr Pro Glu Pro Pro20<210>58<211>20<212>PRT<213>Rattus morvegicus<400>58Pro Glu Pro Pro Gln Glu Leu Glu Asn Asn Gln Thr Met Asn Arg Ala1 5 10 15Glu Asn Gly Gly20<210>59<211>20<212>PRT<213>Rattus norvegicus<400>59Glu Asn Gly Gly Arg Pro Pro His His Pro Tyr Asp Thr Tys Asp Val1 5 10 15Ser Glu Tyr Ser20
<210>60<211>20<212>PRT<213>Rattus norvegicus<400>60Thr Glu Ile Ile Pro Gly Leu Arg Glu Tyr Pro Glu Pro Pro Gln Glu1 5 10 15Leu Glu Asn Asn20<210>61<211>25<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的大鼠SOST肽片段<400>61Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro Gly1 5 10 15Leu Arg Glu Tyr Pro Glu Pro Pro Cys20 25<210>62<211>21<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的大鼠SOST肽片段<400>62Pro Glu Pro Pro Gln Glu Leu Glu Asn Asn Gln Thr Met Asn Arg Ala1 5 10 15Glu Asn Gly Gly Cys20<210>63<211>21<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的大鼠SOST肽片段<400>63Glu Asn Gly Gly Arg Pro Pro His His Pro Tyr Asp Thr Lys Asp Val1 5 10 15Ser Glu Tyr Ser Cys
20<210>64<211>21<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的大鼠SOST肽片段<400>64Thr Glu Ile Ile Pro Gly Leu Arg Glu Tyr Pro Glu Pro Pro Gln Glu1 5 10 15Leu Glu Asn Asn Cys20<210>65<211>190<212>PRT<213>Rattus norvegicus<400>65Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro Gly1 5 10 15Leu Arg Glu Tyr Pro Glu Pro Pro Gln Glu Leu Glu Asn Asn Gln Thr20 25 30Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro His His Pro Tyr Asp35 40 45Thr Lys Asp Val Ser Glu Tyr Ser Cys Arg Glu Leu His Tyr Thr Arg50 55 60Phe Val Thr Asp Gly Pro Cys Arg Ser Ala Lys Pro Val Thr Glu Leu65 70 75 80Val Cys Ser Gly Gln Cys Gly Pro Ala Arg Leu Leu Pro Asn Ala Ile85 90 95Gly Arg Val Lys Trp Trp Arg Pro Asn Gly Pro Asp Phe Arg Cys rle100 105 110Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro Gly Gly115 120 125Ala Ala Pro Arg Ser Arg Lys Val Arg Leu Val Ala Ser Cys Lys Cys130 135 140Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly145 150 155 160Pro Glu Thr Ala Arg Pro Gln Lys Gly Arg Lys Pro Arg Pro Arg Ala165 170 175Arg Gly Ala Lys Ala Asn Gln Ala Glu Leu Glu Asn Ala Tyr180 185 190<210>66<211>20<212>PRT<213>Homo sapiens<400>66
Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro Gly1 5 10 15Gly Glu Ala Pro20<210>67<211>20<212>PRT<213>Homo sapiens<400>67Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg1 5 10 15Leu Val Ala Ser20<210>68<211>21<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的人SOST肽片段<400>68Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro Gly1 5 10 15Gly Glu Ala Pro Cys20<210>69<211>21<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的人SOST肽片段<400>69Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg1 5 10 15Leu Val Ala Ser Cys20<210>70<211>17<212>PRT<213>Rattus Norvegicus<400>70Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro Gly
1 5 10 15Glv<210>71<211>16<212>PRT<213>Rattus norvegicus<400>71Pro Gly Gly Ala Ala Pro Arg Ser Arg Lys Val Arg Leu Val Ala Ser1 5 10 15<210>72<211>18<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的大鼠SOST肽片段<400>72Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Ser Pro Gly1 5 10 15Gly Cys<210>73<211>17<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的大鼠SOST肽片段<400>73Pro Gly Gly Ala Ala Pro Arg Ser Arg Lys Val Arg Leu Val Ala Ser1 5 10 15Cys<210>74<211>20<212>PRT<213>Homo sapiens<400>74Cys Gly Pro Ala Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp1 5 10 15Trp Arg Pro Ser20
<210>75<211>16<212>PRT<213>Homo sapiens<400>75Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser Gly Pro Asp Phe Arg Cys1 5 10 15<210>76<211>18<212>PRT<213>Rattus norvegicus<400>76Pro Asn Ala Ile Gly Arg Val Lys Trp Trp Arg Pro Asn Gly Pro Asp1 5 10 15Phe Arg<210>77<211>19<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的大鼠SOST肽片段<400>77Pro Asn Ala Ile Gly Arg Val Lys Trp Trp Arg Pro Asn Gly Pro Asp1 5 10 15Phe Arg Cys<210>78<211>20<212>PRT<213>Homo sapiens<400>78Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly1 5 10 15Thr Glu Ala Ala20<2l0>79<211>20<212>PRT<213>Homo sapiens
<400>79Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly Arg1 5 10 15Lys Pro Arg Pro20<210>80<211>20<212>PRT<213>Homo sapiens<400>80Arg Pro Gln Lys Gly Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys1 5 10 15Ala Asn Gln Ala20<210>81<211>16<212>PRT<213>Homo sapiens<400>81Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu Leu Glu Asn Ala Tyr1 5 10 15<210>82<211>21<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的人SOST肽片段<400>82Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly1 5 10 15Thr Glu Ala Ala Cys20<210>83<211>21<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的人SOST肽片段<400>83Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly Arg1 5 10 15
Lys Pro Arg Pro Cys20<210>84<211>21<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的人SOST肽片段<400>84Arg Pro Gln Lys Gly Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys1 5 10 15Ala Asn Gln Ala Cys20<210>85<211>17<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的人SOST肽片段<400>85Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu Leu Glu Asn Ala Tyr1 5 10 15Cys<210>86<211>23<212>PRT<213>Rattus norvegicus<400>86Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly1 5 10 15Pro Glu Thr Ala Arg Pro Gln20<210>87<211>23<212>PRT<213>Rattus norvegicus<400>87Lys Gly Arg Lys Pro Arg Pro Arg Ala Arg Gly Ala Lys Ala Asn Gln1 5 10 15Ala Glu Leu Glu Asn Ala Tyr
20<210>88<211>24<212>PRT<213>Rattus norvegicus<400>88Ser Glu Leu Lys Asp Phe Gly Pro Glu Thr Ala Arg Pro Gln Lys Gly1 5 10 15Arg Lys Pro Arg Pro Arg Ala Arg20<210>89<211>24<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的大鼠SOST肽片段<400>89Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly1 5 10 15Pro Glu Thr Ala Arg Pro Gln Cys20<210>90<211>24<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的大鼠SOST肽片段<400>90Lys Gly Arg Lys Pro Arg Pro Arg Ala Arg Gly Ala Lys Ala Asn Gln1 5 10 15Ala Glu Leu Glu Asn Ala Tyr Cys20<210>91<211>25<212>PRT<213>人工序列<220>
<223>添加了额外半胱氨酸的大鼠SOST肽片段<400>91
Ser Glu Leu Lys Asp Phe Gly Pro Glu Thr Ala Arg Pro Gln Lys Gly1 5 10 15Arg Lys Pro Arg Pro Arg Ala Arg Cys20 25<210>92<211>56<212>PRT<213>Homos apiens<400>92Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro Glu1 5 10 15Leu Gly Glu Tyr Pro Glu Pro Pro Pro Glu Leu Glu Asn Asn Lys Thr20 25 30Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro His His Pro Phe Glu35 40 45Thr Lys Asp Val Ser Glu Tyr Ser50 55<210>93<211>56<212>PRT<213>Rattus norvegicus<400>93Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro G1y1 5 10 15Leu Arg Glu Tyr Pro Glu Pro Pro Gln Glu Leu Glu Asn Asn Gln Thr20 25 30Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro His His Pro Tyr Asp35 40 45Thr Lys Asp Val Ser Glu Tyr Ser50 55<210>94<211>32<212>PRT<213>Homo sapiens<400>94Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro1 5 10 15Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg Leu Val Ala Ser Cys20 25 30<210>95<211>32<212>PRT<213>Rattus norvegicus<400>95Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro
1 5 10 15Gly Gly Ala Ala Pro Arg Ser Arg Lys Val Arg Leu Val Ala Ser Cys20 25 30<210>96<211>44<212>PRT<213>Homo sapiens<400>96Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly Thr Glu1 5 10 15Ala Ala Arg Pro Gln Lys Gly Arg Lys Pro Arg Pro Arg Ala Arg Ser20 25 30Ala Lys Ala Asn Gln Ala Glu Leu Glu Asn Ala Tyr35 40<210>97<211>44<212>PRT<213>Rattus norvegicus<400>97Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly Pro Glu1 5 10 15Thr Ala Arg Pro Gln Lys Gly Arg Lys Pro Arg Pro Arg Ala Arg Gly20 25 30Ala Lys Ala Asn Gln Ala Glu Leu Glu Asn Ala Tyr35 40<210>98<211>26<212>PRT<213>Homo sapiens<400>98Cys Gly Pro Ala Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp1 5 10 15Trp Arg Pro Ser Gly Pro Asp Phe Arg Cys20 25<210>99<211>26<212>PRT<213>Rattus norvegicus<400>99Cys Gly Pro Ala Arg Leu Leu Pro Asn Ala Ile Gly Arg Val Lys Trp1 5 10 15Trp Arg Pro Asn Gly Pro Asp Phe Arg Cys20 25
<210>100<211>570<212>DNA<213>Homo sapiens<400>100caggggtggc aggcgttcaa gaatgatgcc acggaaatca tccccgagct cggagagtac 60cccgagcctc caccggagct ggagaacaac aagaccatga accgggcgga gaacggaggg 120cggcctcccc accacccctt tgagaccaaa gacgtgtccg agtacagctg ccgcgagctg 180cacttcaccc gctacgtgac cgatgggccg tgccgcagcg ccaagccggt caccgagctg 240gtgtgctccg gccagtgcgg cccggcgcgc ctgctgccca acgccatcgg ccgcggcaag 300tggtggcgac ctagtgggcc cgacttccgc tgcatccccg accgctaccg cgcgcagcgc 360gtgcagctgc tgtgtcccgg tggtgaggcg ccgcgcgcgc gcaaggtgcg cctggtggcc 420tcgtgcaagt gcaagcgcct cacccgcttc cacaaccagt cggagctcaa ggacttcggg 480accgaggccg ctcggccgca gaagggccgg aagccgcggc cccgcgcccg gagcgccaaa 540gccaaccagg ccgagctgga gaaogcctac 570<210>101<211>570<212>DNA<213>Rattus norvegicus<400>101caggggtggc aagccttcaa gaatgatgcc acagaaatca tcccgggact cagagagtac 60ccagagcctc ctcaggaact agagaacaac cagaccatga accgggccga gaacggaggc 120agaccccccc accatcctta tgacaccaaa gacgtgtccg agtacagctg ccgcgagctg 180cactacaccc gcttcgtgac cgacggcccg tgccgcagtg ccaagccggt caccgagttg 240gtgtgctcgg gccagtgcgg ccccgcgcgg ctgctgccca acgccatcgg gcgcgtgaag 300tggtggcgcc cgaacggacc cgacttccgc tgcatcccgg atcgctaccg ogcgcagcgg 360gtgcagctgc tgtgccccgg cggcgcggcg ccgcgctcgc gcaaggtgcg tctggtggcc 420tcgtgcaagt gcaagcgcct cacccgcttc cacaaccagt cggagctcaa ggacttcgga 480cctgagaccg cgcggccgca gaagggtcgc aagccgcggc cccgcgcccg gggagccaaa 540gccaaccagg cggagctgga gaacgcctac 570<210>102<211>532<212>PRT<213>Homo sapiens<400>102Met Thr Gln Leu Tyr Ile Tyr Ile Arg Leu Leu Gly Ala Tyr Leu Phe1 5 10 15Ile Ile Ser Arg Val Gln Gly Gln Asn Leu Asp Ser Met Leu His Gly20 25 30Thr Gly Met Lys Ser Asp Ser Asp Gln Lys Lys Ser Glu Asn Gly Val35 40 45Thr Leu Ala Pro Glu Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys Ser50 55 60Gly His Cys Pro Asp Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn Gly65 70 75 80His Cys Phe Ala Ile Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr Leu85 90 95Ala Ser Gly Cys Met Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys Asp100 105 110Ser Pro lys Ala Gln Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr Asn115 120 125
Leu Cys Asn Gln Tyr Leu Gln Pro Thr Leu Pro Pro Val Val Ile Gly130 135 140Pro Phe Phe Asp Gly Ser Ile Arg Trp Leu Val Leu Leu Ile Ser Met145 150 155 160Ala Val Cys Ile Ile Ala Met Ile Ile Phe Ser Ser Cys Phe Cys Tyr165 170 175Lys His Tyr Cys Lys Ser Ile Ser Ser Arg Arg Arg Tyr Asn Arg Asp180 185 190Leu Glu Gln Asp Glu Ala Phe Ile Pro Val Gly Glu Ser Leu Lys Asp195 200 205Leu Ile Asp Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu Pro Leu210 215 220Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Arg Gln Val225 230 235 240Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg Gly Glu245 250 255Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser Trp Phe260 265 270Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu Asn Ile275 280 285Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp Thr Gln290 295 300Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr Asp Phe305 310 315 320Leu Lys Cys Ala Thr Leu Asp Thr Arg Ala Leu Leu Lys Leu Ala Tyr325 330 335Ser Ala Ala Cys Gly Leu Cys His Leu His Thr Glu Ile Tyr Gly Thr340 345 350Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile355 360 365Leu Ile Lys Lys Asn Gly Ser Cys Cys Ile Ala Asp Leu Gly Leu Ala370 375 380Val Lys Phe Asn Ser Asp Thr Asn Glu Val Asp Val Pro Leu Asn Thr385 390 395 400Arg Val Gly Thr Lys Arg Tyr Met Ala Pro Glu Val Leu Asp Glu Ser405 410 415Leu Asn Lys Asn His Phe Gln Pro Tyr Ile Met Ala Asp Ile Tyr Ser420 425 430Phe Gly Leu Ile Ile Trp Glu Met Ala Arg Arg Cys Ile Thr Gly Gly435 440 445Ile Val Glu Glu Tyr Gln Leu Pro Tyr Tyr Asn Met Val Pro Ser Asp450 455 460Pro Ser Tyr Glu Asp Met Arg Glu Val Val Cys Val Lys Arg Leu Arg465 470 475 480Pro Ile Val Ser Asn Arg Trp Asn Ser Asp Glu Cys Leu Arg Ala Val485 490 495Leu Lys Leu Met Ser Glu Cys Trp Ala His Asn Pro Ala Ser Arg Leu500 505 510Thr Ala Leu Arg Ile Lys Lys Thr Leu Ala Lys Met Val Glu Ser Gln515 520 525Asp Val Lys Ile530<210>103<211>502<212>PRT
<213>Homo sapiens<400>103Met Leu Leu Arg Ser Ala Gly Lys Leu Asn Val Gly Thr Lys Lys Glu1 5 10 15Asp Gly Glu Ser Thr Ala Pro Thr Pro Arg Pro Lys Val Leu Arg Cys20 25 30Lys Cys His His His Cys Pro Glu Asp Ser Val Asn Asn Ile Cys Ser35 40 45Thr Asp Gly Tyr Cys Phe Thr Met Ile Glu Glu Asp Asp Ser Gly Leu50 55 60Pro Val Val Thr Ser Gly Cys Leu Gly Leu Glu Gly Ser Asp Phe Gln65 70 75 80Cys Arg Asp Thr Pro Ile Pro His Gln Arg Arg Ser Ile Glu Cys Cys85 90 95Thr Glu Arg Asn Glu Cys Asn Lys Asp Leu His Pro Thr Leu Pro Pro100 105 110Leu Lys Asn Arg Asp Phe Val Asp Gly Pro Ile His His Arg Ala Leu115 120 125Leu Ile Ser Val Thr Val Cys Ser Leu Leu Leu Val Leu Ile Ile Leu130 135 140Phe Cys Tyr Phe Arg Tyr Lys Arg Gln Glu Thr Arg Pro Arg Tyr Ser145 150 155 160Ile Gly Leu Glu Gln Asp Glu Thr Tyr Ile Pro Pro Gly Glu Ser Leu165 170 175Arg Asp Leu Ile Glu Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu180 185 190Pro Leu Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Lys195 200 205Gln Ile Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg210 215 220Gly Glu Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser225 230 235 240Trp Phe Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu245 250 255Asn Ile Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp260 265 270Thr Gln Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr275 280 285Asp Tyr Leu Lys Ser Thr Thr Leu Asp Ala Lys Ser Met Leu Lys Leu290 295 300Ala Tyr Ser Ser Val Ser Gly Leu Cys His Leu His Thr Glu Ile Phe305 310 315 320Ser Thr Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys325 330 335Asn Ile Leu Val Lys Lys Asn Gly Thr Cys Cys Ile Ala Asp Leu Gly340 345 350Leu Ala Val Lys Phe Ile Ser Asp Thr Asn Glu Val Asp Ile Pro Pro355 360 365Asn Thr Arg Val Gly Thr Lys Arg Tyr Met Pro Pro Glu Val Leu Asp370 375 380Glu Ser Leu Asn Arg Asn His Phe Gln Ser Tyr Ile Met Ala Asp Met385 390 395 400Tyr Ser Phe Gly Leu Ile Leu Trp Glu Val Ala Arg Arg Cys Val Ser405 410 415Gly Gly Ile Val Glu Glu Tyr Gln Leu Pro Tyr His Asp Leu Val Pro420 425 430
Ser Asp Pro Ser Tyr Glu Asp Met Arg Glu Ile Val Cys Ile Lys Lys435 440 445Leu Arg Pro Ser Phe Pro Asn Arg Trp Ser Ser Asp Glu Cys Leu Arg450 455 460Gln Met Gly Lys Leu Met Thr Glu Cys Trp Ala His Asn Pro Ala Ser465 470 475 480Arg Leu Thr Ala Leu Arg Val Lys Lys Thr Leu Ala Lys Met Ser Glu485 490 495Ser Gln Asp Ile Lys Leu500<210>104<211>502<212>PRT<213>Homo sapiens<400>104Met Leu Leu Arg Ser Ala Gly Lys Leu Asn Val Gly Thr Lys Lys Glu1 5 10 15Asp Gly Glu Ser Thr Ala Pro Thr Pro Arg Pro Lys Val Leu Arg Cys20 25 30Lys Cys His His His Cys Pro Glu Asp Ser Val Asn Asn Ile Cys Ser35 40 45Thr Asp Gly Tyr Cys Phe Thr Met Ile Glu Glu Asp Asp Ser Gly Leu50 55 60Pro Val Val Thr Ser Gly Cys Leu Gly Leu Glu Gly Ser Asp Phe Gln65 70 75 80Cys Arg Asp Thr Pro Ile Pro His Gln Arg Arg Ser Ile Glu Cys Cys85 90 95Thr Glu Arg Asn Glu Cys Asn Lys Asp Leu His Pro Thr Leu Pro Pro100 105 110Leu Lys Asn Arg Asp Phe Val Asp Gly Pro Ile His His Arg Ala Leu115 120 125Leu Ile Ser Val Thr Val Cys Ser Leu Leu Leu Val Leu Ile Ile Leu130 135 140Phe Cys Tyr Phe Arg Tyr Lys Arg Gln Glu Thr Arg Pro Arg Tyr Ser145 150 155 160Ile Gly Leu Glu Gln Asp Glu Thr Tyr Ile Pro Pro Gly Glu Ser Leu165 170 175Arg Asp Leu Ile Glu Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu180 185 190Pro Leu Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Lys195 200 205Gln Ile Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg210 215 220Gly Glu Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser225 230 235 240Trp Phe Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu245 250 255Asn Ile Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp260 265 270Thr Gln Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr275 280 285Asp Tyr Leu Lys Ser Thr Thr Leu Asp Ala Lys Ser Met Leu Lys Leu290 295 300Ala Tyr Ser Ser Val Ser Gly Leu Cys His Leu His Thr Glu Ile Phe
305 310 315 320Ser Thr Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys325 330 335Asn Ile Leu Val Lys Lys Asn Gly Thr Cys Cys Ile Ala Asp Leu Gly340 345 350Leu Ala Val Lys Phe Ile Ser Asp Thr Asn Glu Val Asp Ile Pro Pro355 360 365Asn Thr Arg Val Gly Thr Lys Arg Tyr Met Pro Pro Glu Val Leu Asp370 375 380Glu Ser Leu Asn Arg Asn His Phe Gln Ser Tyr Ile Met Ala Asp Met385 390 395 400Tyr Ser Phe Gly Leu Ile Leu Trp Glu Val Ala Arg Arg Cys Val Ser405 410 415Gly Gly Ile Val Glu Glu Tyr Gln Leu Pro Tyr His Asp Leu Val Pro420 425 430Ser Asp Pro Ser Tyr Glu Asp Met Arg Glu Ile Val Cys Lle Lys Lys435 440 445Leu Arg Pro Ser Phe Pro Asn Arg Trp Ser Ser Asp Glu Cys Leu Arg450 455 460Gln Met Gly Lys Leu Met Thr Glu Cys Trp Ala His Asn Pro Ala Ser465 470 475 480Arg Leu Thr Ala Leu Arg Val Lys Lys Thr Leu Ala Lys Met Ser Glu485 490 495Ser Gln Asp Ile Lys Leu500<210>105<211>532<212>PRT<213>Rattus sp.
<400>105Met Thr Gln Leu Tyr Thr Tyr Ile Arg Leu Leu Gly Ala Cys Leu Phe1 5 10 15Ile Ile Ser His Val Gln Gly Gln Asn Leu Asp Ser Met Leu His Gly20 25 30Thr Gly Met Lys Ser Asp Val Asp Gln Lys Lys Pro Glu Asn Gly Val35 40 45Thr Leu Ala Pro Glu Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys Ser50 55 60Gly His Cys Pro Asp Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn Gly65 70 75 80His Cys Phe Ala Ile Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr Leu85 90 95Thr Ser Gly Cys Met Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys Asp100 105 110Ser Pro Lys Ala Gln Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr Asn115 120 125Leu Cys Asn Gln Tyr Leu Gln Pro Thr Leu Pro Pro Val Val Ile Gly130 135 140Pro Phe Phe Asp Gly Ser Val Arg Trp Leu Ala Val Leu Ile Ser Met145 150 155 160Ala Val Cys Ile Val Ala Met Ile Val Phe Ser Ser Cys Phe Cys Tyr165 170 175Lys His Tyr Cys Lys Ser Ile Ser Ser Arg Gly Arg Tyr Asn Arg Asp180 185 190
Leu Glu Gln Asp Glu Ala Phe Ile Pro Val Gly Glu Ser Leu Lys Asp195 200 205Leu Ile Asp Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu Pro Leu210 215 220Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Arg Gln Val225 230 235 240Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg Gly Glu245 250 255Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser Trp Phe260 265 270Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu Asn Ile275 280 285Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp Thr Gln290 295 300Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr Asp Phe305 310 315 320Leu Lys Cys Ala Thr Leu Asp Thr Arg Ala Leu Leu Lys Leu Ala Tyr325 330 335Ser Ala Ala Cys Gly Leu Cys His Leu His Thr Glu Ile Tyr Gly Thr340 345 350Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile355 360 365Leu Ile Lys Lys Asn Gly Ser Cys Cys Ile Ala Asp Leu Gly Leu Ala370 375 380Val Lys Phe Asn Ser Asp Thr Asn Glu Val Asp Ile Pro Leu Asn Thr385 390 395 400Arg Val Gly Thr Arg Arg Tyr Met Ala Pro Glu Val Leu Asp Glu Ser405 410 415Leu Ser Lys Asn His Phe Gln Pro Tyr Ile Met Ala Asp Ile Tyr Ser420 425 430Phe Gly Leu Ile Ile Trp Glu Met Ala Arg Arg Cys Ile Thr Gly Gly435 440 445Ile Val Glu Glu Tyr Gln Leu Pro Tyr Tyr Asn Met Val Pro Ser Asp450 455 460Pro Ser Tyr Glu Asp Met Arg Glu Val Val Cys Val Lys Arg Leu Arg465 470 475 480Pro Ile Val Ser Asn Arg Trp Asn Ser Asp Glu Cys Leu Arg Ala Val485 490 495Leu Lys Leu Met Ser Glu Cys Trp Ala His Asn Pro Ala Ser Arg Leu500 505 510Thr Ala Leu Arg Ile Lys Lys Thr Leu Ala Lys Met Val Glu Ser Gln515 520 525Asp Val Lys Ile530<210>106<211>532<212>PRT<213>Rattus norvegicus<400>106Met Thr Gln Leu Tyr Thr Tyr Ile Arg Leu Leu Gly Ala Cys Leu Phe1 5 10 15Ile Ile Ser His Val Gln Gly Gln Asn Leu Asp Ser Met Lau His Gly20 25 30Thr Gly Met Lys Ser Asp Val Asp Gln Lys Lys Pro Glu Asn Gly Val
35 40 45Thr Leu Ala Pro Glu Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys Ser50 55 60Gly His Cys Pro Asp Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn Gly65 70 75 80His Cys Phe Ala Ile Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr Leu85 90 95Thr Ser Gly Cys Met Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys Asp100 105 110Ser Pro Lys Ala Gln Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr Asn115 120 125Leu Cys Asn Gln Tyr Leu Gln Pro Thr Leu Pro Pro Val Val Ile Gly130 135 140Pro Phe Phe Asp Gly Ser Val Arg Trp Leu Ala Val Leu Ile Ser Met145 150 155 160Ala Val Cys Ile Val Ala Met Ile Val Phe Ser Ser Cys Phe Cys Tyr165 170 175Lys His Tyr Cys Lys Ser Ile Ser Ser Arg Gly Arg Tyr Asn Arg Asp180 185 190Leu Glu Gln Asp Glu Ala Phe Ile Pro Val Gly Glu Ser Leu Lys Asp195 200 205Leu Ile Asp Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu Pro Leu210 215 220Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Arg Gln Val225 230 235 240Gly Lys Gly Arg Tyr Gly Glu Val TrP Met Gly Lys Trp Arg Gly Glu245 250 255Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser Trp Phe260 265 270Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu Asn Ile275 280 285Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp Thr Gln290 295 300Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr Asp Phe305 310 315 320Leu Lys Cys Ala Thr Leu Asp Thr Arg Ala Leu Leu Lys Leu Ala Tyr325 330 335Ser Ala Ala Cys Gly Leu Cys His Leu His Thr Glu Ile Tyr Gly Thr340 345 350Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile355 360 365Leu Ile Lys Lys Asn Gly Ser Cys Cys Ile Ala Asp Leu Gly Leu Ala370 375 380Val Lys Phe Asn Ser Asp Thr Asn Glu Val Asp Ile Pro Leu Asn Thr385 390 395 400Arg Val Gly Thr Arg Arg Tyr Met Ala Pro Glu Val Leu Asp Glu Ser405 410 415Leu Ser Lys Asn His Phe Gln Pro Tyr Ile Met Ala Asp Ile Tyr Ser420 425 430Phe Gly Leu Ile Ile Trp Glu Met Ala Arg Arg Cys Ile Thr Gly Gly435 440 445Ile Val Glu Glu Tyr Gln Leu Pro Tyr Tyr Asn Met Val Pro Ser Asp450 455 460Pro Ser Tyr Glu Asp Met Arg Glu Val Val Cys Val Lys Arg Leu Arg465 470 475 480Pro Ile Val Ser Asn Arg Trp Asn Ser Asp Glu Cys Leu Arg Ala Val485 490 495
Leu Lys Leu Met Ser Glu Cys Trp Ala His Asn Pro Ala Ser Arg Leu500 505 510Thr Ala Leu Arg Ile Lys Lys Thr Leu Ala Lys Met Val Glu Ser Gln515 520 525Asp Val Lys Ile530<210>107<211>532<212>PRT<213>Rattus norvegicus<400>107Met Thr Gln Leu Tyr Thr Tyr Ile Arg Leu Leu Gly Ala Cys Leu Phe1 5 10 15Ile Ile Ser His Val Gln Gly Gln Asn Leu Asp Ser Met Leu His Gly20 25 30Thr Gly Met Lys Ser Asp Val Asp Gln Lys Lys Pro Glu Asn Gly Val35 40 45Thr Leu Ala Pro Glu Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys Ser50 55 60Gly His Cys Pro Asp Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn Gly65 70 75 80His Cys Phe Ala Ile Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr Leu85 90 95Thr Ser Gly Cys Met Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys Asp100 105 110Ser Pro Lys Ala Gln Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr Asn115 120 125Leu Cys Asn Gln Tyr Leu Gln Pro Thr Leu Pro Pro Val Val Ile Gly130 135 140Pro Phe Phe Asp Gly Ser Val Arg Trp Leu Ala Val Leu Ile Ser Met145 150 155 160Ala Val Cys Ile Val Ala Met Ile Val Phe Ser Ser Cys Phe Cys Tyr165 170 175Lys His Tyr Cys Lys Ser Ile Ser Ser Arg Gly Arg Tyr Asn Arg Asp180 185 190Leu Glu Gln Asp Glu Ala Phe Ile Pro Val Gly Glu Ser Leu Lys Asp195 200 205Leu Ile Asp Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu Pro Leu210 215 220Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Arg Gln Val225 230 235 240Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg Gly Glu245 250 255Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser Trp Phe260 265 270Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu Asn Ile275 280 285Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp Thr Gln290 295 300Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr Asp Phe305 310 315 320Leu Lys Cys Ala Thr Leu Asp Thr Arg Ala Leu Leu Lys Leu Ala Tyr325 330 335Ser Ala Ala Cys Gly Leu Cys His Leu His Thr Glu Ile Tyr Gly Thr
340 345 350Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile355 360 365Leu Ile Lys Lys Asn Gly Ser Cys Cys Ile Ala Asp Leu Gly Leu Ala370 375 380Val Lys Phe Asn Ser Asp Thr Asn Glu Val Asp Ile Pro Leu Asn Thr385 390 395 400Arg Val Gly Thr Arg Arg Tyr Met Ala Pro Glu Val Leu Asp Glu Ser405 410 415Leu Ser Lys Asn His Phe Gln Pro Tyr Ile Met Ala Asp Ile Tyr Ser420 425 430Phe Gly Leu Ile Ile Trp Glu Met Ala Arg Arg Cys Ile Thr Gly Gly435 440 445Ile Val Glu Glu Tyr Gln Leu Pro Tyr Tyr Asn Met Val Pro Ser Asp450 455 460Pro Ser Tyr Glu Asp Met Arg Glu Val Val Cys Val Lys Arg Leu Arg465 470 475 480Pro Ile Val Ser Asn Arg Trp Asn Ser Asp Glu Cys Leu Arg Ala Val485 490 495Leu Lys Leu Met Ser Glu Cys Trp Ala His Asn Pro Ala Ser Arg Leu500 505 510Thr Ala Leu Arg Ile Lys Lys Thr Leu Ala Lys Met Val Glu Ser Gln515 520 525Asp Val Lys Ile530<210>108<211>502<212>PRT<213>Homo sapiens<400>108Met Leu Leu Arg Ser Ala Gly Lys Leu Asn Val Gly Thr Lys Lys Glu1 5 10 15Asp Gly Glu Ser Thr Ala Pro Thr Pro Arg Pro Lys Val Leu Arg Cys20 25 30Lys Cys His His His Cys Pro Glu Asp Ser Val Asn Asn Ile Cys Ser35 40 45Thr Asp Gly Tyr Cys Phe Thr Met Ile Glu Glu Asp Asp Ser Gly Leu50 55 60Pro Val Val Thr Ser Gly Cys Leu Gly Leu Glu Gly Ser Asp Phe Gln65 70 75 80Cys Arg Asp Thr Pro Ile Pro His Gln Arg Arg Ser Ile Glu Cys Cys85 90 95Thr Glu Arg Asn Glu Cys Asn Lys Asp Leu His Pro Thr Leu Pro Pro100 105 110Leu Lys Asn Arg Asp Phe Val Asp Gly Pro Ile His His Arg Ala Leu115 120 125Leu Ile Ser Val Thr Val Cys Ser Leu Leu Leu Val Leu Ile Ile Leu130 135 140Phe Cys Tyr Phe Arg Tyr Lys Arg Gln Glu Thr Arg Pro Arg Tyr Ser145 150 155 160Ile Gly Leu Glu Gln Asp Glu Thr Tyr Ile Pro Pro Gly Glu Ser Leu165 170 175Arg Asp Leu Ile Glu Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu180 185 190
Pro Leu Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Lys195 200 205Gln Ile Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg210 215 220Gly Glu Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser225 230 235 240Trp Phe Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu245 250 255Asn Ile Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp260 265 270Thr Gln Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr275 280 285Asp Tyr Leu Lys Ser Thr Thr Leu Asp Ala Lys Ser Met Leu Lys Leu290 295 300Ala Tyr Ser Ser Val Ser Gly Leu Cys His Leu His Thr Glu Ile Phe305 310 315 320Ser Thr Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys325 330 335Asn Ile Leu Val Lys Lys Asn Gly Thr Cys Cys Ile Ala Asp Leu Gly340 345 350Leu Ala Val Lys Phe Ile Ser Asp Thr Asn Glu Val Asp Ile Pro Pro355 360 365Asn Thr Arg Val Gly Thr Lys Arg Tyr Met Pro Pro Glu Val Leu Asp370 375 380Glu Ser Leu Asn Arg Asn His Phe Gln Ser Tyr Ile Met Ala Asp Met385 390 395 400Tyr Ser Phe Gly Leu Ile Leu Trp Glu Val Ala Arg Arg Cys Val Ser405 410 415Gly Gly Ile Val Glu Glu Tyr Gln Leu Pro Tyr His Asp Leu Val Pro420 425 430Ser Asp Pro Ser Tyr Glu Asp Met Arg Glu Ile Val Cys Ile Lys Lys435 440 445Leu Arg Pro Ser Phe Pro Asn Arg Trp Ser Ser Asp Glu Cys Leu Arg450 455 460Gln Met Gly Lys Leu Met Thr Glu Cys Trp Ala His Asn Pro Ala Ser465 470 475 480Arg Leu Thr Ala Leu Arg Val Lys Lys Thr Leu Ala Lys Met Ser Glu485 490 495Ser Gln Asp Ile Lys Leu500<210>109<21l>502<212>PRT<213>Homo sapiens<400>109Met Leu Leu Arg Ser Ala Gly Lys Leu Asn Val Gly Thr Lys Lys Glu1 5 10 15Asp Gly Glu Ser Thr Ala Pro Thr Pro Arg Pro Lys Val Leu Arg Cys20 25 30Lys Cys His His His Cys Pro Glu Asp Ser Val Asn Asn Ile Cys Ser35 40 45Thr Asp Gly Tyr Cys Phe Thr Met Ile Glu Glu Asp Asp Ser Gly Leu50 55 60Pro Val Val Thr Ser Gly Cys Leu Gly Leu Glu Gly Ser Asp Phe Gln
65 70 75 80Cys Arg Asp Thr Pro Ile Pro His Gln Arg Arg Ser Ile Glu Cys Cys85 90 95Thr Glu Arg Asn Glu Cys Asn Lys Asp Leu His Pro Thr Leu Pro Pro100 105 110Leu Lys Asn Arg Asp Phe Val Asp Gly Pro Ile His His Arg Ala Leu115 120 125Leu Ile Ser Val Thr Val Cys Ser Leu Leu Leu Val Leu Ile Ile Leu130 135 140Phe Cys Tyr Phe Arg Tyr Lys Arg Gln Glu Thr Arg Pro Arg Tyr Ser145 150 155 160Ile Gly Leu Glu Gln Asp Glu Thr Tyr Ile Pro Pro Gly Glu Ser Leu165 170 175Arg Asp Leu Ile Glu Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu180 185 190Pro Leu Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Lys195 200 205Gln Ile Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg210 215 220Gly Glu Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser225 230 235 240Trp Phe Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu245 250 255Asn Ile Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp260 265 270Thr Gln Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr275 280 285Asp Tyr Leu Lys Ser Thr Thr Leu Asp Ala Lys Ser Met Leu Lys Leu290 295 300Ala Tyr Ser Ser Val Ser Gly Leu Cys His Leu His Thr Glu Ile Phe305 310 315 320Ser Thr Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys325 330 335Asn Ile Leu Val Lys Lys Asn Gly Thr Cys Cys Ile Ala Asp Leu Gly340 345 350Leu Ala Val Lys Phe Ile Ser Asp Thr Asn Glu Val Asp Ile Pro Pro355 360 365Asn Thr Arg Val Gly Thr Lys Arg Tyr Met Pro Pro Glu Val Leu Asp370 375 380Glu Ser Leu Asn Arg Asn His Phe Gln Ser Tyr Ile Met Ala Asp Met385 390 395 400Tyr Ser Phe Gly Leu Ile Leu Trp Glu Val Ala Arg Arg Cys Val Ser405 410 415Gly Gly Ile Val Glu Glu Tyr Gln Leu Pro Tyr His Asp Leu Val Pro420 425 430Ser Asp Pro Ser Tyr Glu Asp Met Arg Glu Ile Val Cys Ile Lys Lys435 440 445Leu Arg Pro Ser Phe Pro Asn Arg Trp Ser Ser Asp Glu Cys Leu Arg450 455 460Gln Met Gly Lys Leu Met Thr Glu Cys Trp Ala His Asn Pro Ala Ser465 470 475 480Arg Leu Thr Ala Leu Arg Val Lys Lys Thr Leu Ala Lys Met Ser Glu485 490 495Ser Gln Asp Ile Lys Leu500
<210>110<211>532<212>PRT<213>Rattus sp.
<400>110Met Thr Gln Leu Tyr Thr Tyr Ile Arg Leu Leu Gly Ala Cys Leu Phe1 5 10 15Ile Ile Ser His Val Gln Gly Gln Asn Leu Asp Ser Met Leu His Gly20 25 30Thr Gly Met Lys Ser Asp Val Asp Gln Lys Lys Pro Glu Asn Gly Val35 40 45Thr Leu Ala Pro Glu Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys Ser50 55 60Gly His Cys Pro Asp Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn Gly65 70 75 80His Cys Phe Ala Ile Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr Leu85 90 95Thr Ser Gly Cys Met Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys Asp100 105 110Ser Pro Lys Ala Gln Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr Asn115 120 125Leu Cys Asn Gln Tyr Leu Gln Pro Thr Leu Pro Pro Val Val Ile Gly130 135 140Pro Phe Phe Asp Gly Ser Val Arg Trp Leu Ala Val Leu Ile Ser Met145 150 155 160Ala Val Cys Ile Val Ala Met Ile Val Phe Ser Ser Cys Phe Cys Tyr165 170 175Lys His Tyr Cys Lys Ser Ile Ser Ser Arg Gly Arg Tyr Asn Arg Asp180 185 190Leu Glu Gln Asp Glu Ala Phe Ile Pro Val Gly Glu Ser Leu Lys Asp195 200 205Leu Ile Asp Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu Pro Leu210 215 220Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Arg Gln Val225 230 235 240Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg Gly Glu245 250 255Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser Trp Phe260 265 270Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu Asn Ile275 280 285Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp Thr Gln290 295 300Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr Asp Phe305 310 315 320Leu Lys Cys Ala Thr Leu Asp Thr Arg Ala Leu Leu Lys Leu Ala Tyr325 330 335Ser Ala Ala Cys Gly Leu Cys His Leu His Thr Glu Ile Tyr Gly Thr340 345 350Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile355 360 365Leu Ile Lys Lys Asn Gly Ser Cys Cys Ile Ala Asp Leu Gly Leu Ala370 375 380Val Lys Phe Asn Ser Asp Thr Asn Glu Val Asp rle Pro Leu Asn Thr385 390 395 400Arg Val Gly Thr Arg Arg Tyr Met Ala Pro Glu Val Leu Asp Glu Ser
405 410 415Leu Ser Lys Asn His Phe Gln Pro Tyr Ile Met Ala Asp Ile Tyr Ser420 425 430Phe Gly Leu Ile Ile Trp Glu Met Ala Arg Arg Cys Ile Thr Gly Gly435 440 445Ile Val Glu Glu Tyr Gln Leu Pro Tyr Tyr Asn Met Val Pro Ser Asp450 455 460Pro Ser Tyr Glu Asp Met Arg Glu Val Val Cys Val Lys Arg Leu Arg465 470 475 480Pro Ile Val Ser Asn Arg Trp Asn Ser Asp Glu Cys Leu Arg Ala Val485 490 495Leu Lys Leu Met Ser Glu Cys Trp Ala His Asn Pro Ala Ser Arg Leu500 505 510Thr Ala Leu Arg Ile Lys Lys Thr Leu Ala Lys Met Val Glu ser Gln515 520 525Asp Val Lys Ile530<210>111<211>530<212>PRT<213>Homo sapiens<400>111Met Thr Ser Ser Leu Gln Arg Pro Trp Arg Val Pro Trp Leu Pro Trp1 5 10 15Thr Ile Leu Leu Val Ser Thr Ala Ala Ala Ser Gln Asn Gln Glu Arg20 25 30Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln Asp Leu Gly Ile Gly Glu35 40 45Ser Arg Ile Ser His Glu Asn Gly Thr Ile Leu Cys Ser Lys Gly Ser50 55 60Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys Gly Asp Ile Asn Leu Val65 70 75 80Lys Gln Gly Cys Trp Ser His Ile Gly Asp Pro Gln Glu Cys His Tyr85 90 95Glu Glu Cys Val Val Thr Thr Thr Pro Pro Ser Ile Gln Asn Gly Thr100 105 110Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu Cys Asn Val Asn Phe Thr115 120 125Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro Leu Ser Pro Pro His Ser130 135 140Phe Asn Arg Asp Glu Thr Ile Ile Ile Ala Leu Ala Ser Val Ser Val145 150 155 160Leu Ala Val Leu Ile Val Ala Leu Cys Phe Gly Tyr Arg Met Leu Thr165 170 175Gly Arg Arg Lys Gln Gly Leu His Ser Met Asn Met Met Glu Ala Ala180 185 190Ala Ser Glu Pro Ser Leu Asp Leu Asp Asn Leu Lys Leu Leu Glu Leu195 200 205Ile Gly Arg Gly Arg Tyr Gly Ala Val Tyr Lys Gly Ser Leu Asp Glu210 215 220Arg Pro Val Ala Val Lys Val Phe Ser Phe Ala Asn Arg Gln Asn Phe225 230 235 240Ile Asn Glu Lys Asn Ile Tyr Arg Val Pro Leu Met Glu His Asp Asn245 250 255
Ile Ala Arg Phe Ile Val Gly Asp Glu Arg Val Thr Ala Asp Gly Arg260 265 270Met Glu Tyr Leu Leu Val Met Glu Tyr Tyr Pro Asn Gly Ser Leu Cys275 280 285Lys Tyr Leu Ser Leu His Thr Ser Asp Trp Val Ser Ser Cys Arg Leu290 295 300Ala His Ser Val Thr Arg Gly Leu Ala Tyr Leu His Thr Glu Leu Pro305 310 315 320Arg Gly Asp His Tyr Lys Pro Ala Ile Ser His Arg Asp Leu Asn Ser325 330 335Arg Asn Val Leu Val Lys Asn Asp Gly Thr Cys Val Ile Ser Asp Phe340 345 350Gly Leu Ser Met Arg Leu Thr Gly Asn Arg Leu Val Arg Pro Gly Glu355 360 365Glu Asp Asn Ala Ala Ile Ser Glu Val Gly Thr Ile Arg Tyr Met Ala370 375 380Pro Glu Val Leu Glu Gly Ala Val Asn Leu Arg Asp Cys Glu Ser Ala385 390 395 400Leu Lys Gln Val Asp Met Tyr Ala Leu Gly Leu Ile Tyr Trp Glu Ile405 410 415Phe Met Arg Cys Thr Asp Leu Phe Pro Gly Glu Ser Val Pro Glu Tyr420 425 430Gln Met Ala Phe Gln Thr Glu Val Gly Asn His Pro Thr Phe Glu Asp435 440 445Met Gln Val Leu Val Ser Arg Glu Lys Gln Arg Pro Lys Phe Pro Glu450 455 460Ala Trp Lys Glu Asn Ser Leu Ala Val Arg Ser Leu Lys Glu Thr Ile465 470 475 480Glu Asp Cys Trp Asp Gln Asp Ala Glu Ala Arg Leu Thr Ala Gln Cys485 490 495Ala Glu Glu Arg Met Ala Glu Leu Met Met Ile Trp Glu Arg Asn Lys500 505 510Ser Val Ser Pro Thr Val Asn Pro Met Ser Thr Ala Met Gln Asn Glu515 520 525Arg Arg530<210>112<211>530<212>PRT<213>Homo sapiens<400>112Met Thr Ser Ser Leu Gln Arg Pro Trp Arg Val Pro Trp Leu Pro Trp1 5 10 15Thr Ile Leu Leu Val Ser Thr Ala Ala Ala Ser Gln Asn Gln Glu Arg20 25 30Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln Asp Leu Gly Ile Gly Glu35 40 45Ser Arg Ile Ser His Glu Asn Gly Thr Ile Leu Cys Ser Lys Gly Ser50 55 60Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys Gly Asp Ile Asn Leu Val65 70 75 80Lys Gln Gly Cys Trp Ser His Ile Gly Asp Pro Gln Glu Cys His Tyr85 90 95Glu Glu Cys Val Val Thr Thr Thr Pro Pro Ser Ile Gln Asn Gly Thr
100 105 110Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu Cys Asn Val Asn Phe Thr115 120 125Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro Leu Ser Pro Pro His Ser130 135 140Phe Asn Arg Asp Glu Thr Ile Ile Ile Ala Leu Ala Ser Val Ser Val145 150 155 160Leu Ala Val Leu Ile Val Ala Leu Cys Phe Gly Tyr Arg Met Leu Thr165 170 175Gly Asp Arg Lys Gln Gly Leu His Ser Met Asn Met Met Glu Ala Ala180 185 190Ala Ser Glu Pro Ser Leu Asp Leu Asp Asn Leu Lys Leu Leu Glu Leu195 200 205Ile Gly Arg Gly Arg Tyr Gly Ala Val Tyr Lys Gly Ser Leu Asp Glu210 215 220Arg Pro Val Ala Val Lys Val Phe Ser Phe Ala Asn Arg Gln Asn Phe225 230 235 240Ile Asn Glu Lys Asn Ile Tyr Arg Val Pro Leu Met Glu His Asp Asn245 250 255Ile Ala Arg Phe Ile Val Gly Asp Glu Arg Val Thr Ala Asp Gly Arg260 265 270Met Glu Tyr Leu Leu Val Met Glu Tyr Tyr Pro Asn Gly Ser Leu Cys275 280 285Lys Tyr Leu Ser Leu His Thr Ser Asp Trp Val Ser Ser Cys Arg Leu290 295 300Ala His Ser Val Thr Arg Gly Leu Ala Tyr Leu His Thr Glu Leu Pro305 310 315 320Arg Gly Asp His Tyr Lys Pro Ala Ile Ser His Arg Asp Leu Asn Ser325 330 335Arg Asn Val Leu Val Lys Asn Asp Gly Thr Cys Val Ile Ser Asp Phe340 345 350Gly Leu Ser Met Arg Leu Thr Gly Asn Arg Leu Val Arg Pro Gly Glu355 360 365Glu Asp Asn Ala Ala Ile Ser Glu Val Gly Thr Ile Arg Tyr Met Ala370 375 380Pro Glu Val Leu Glu Gly Ala Val Asn Leu Arg Asp Cys Glu Ser Ala385 390 395 400Leu Lys Gln Val Asp Met Tyr Ala Leu Gly Leu Ile Tyr Trp Glu Ile405/410 415Phe Met Arg Cys Thr Asp Leu Phe Pro Gly Glu Ser Val Pro Glu Tyr420 425 430Gln Met Ala Phe Gln Thr Glu Val Gly Asn His Pro Thr Phe Glu Asp435 440 445Met Gln Val Leu Val Ser Arg Glu Lys Gln Arg Pro Lys Phe Pro Glu450 455 460Ala Trp Lys Glu Asn Ser Leu Ala Val Arg Ser Leu Lys Glu Thr Ile465 470 475 480Glu Asp Cys Trp Asp Gln Asp Ala Glu Ala Arg Leu Thr Ala Gln Cys485 490 495Ala Glu Glu Arg Met Ala Glu Leu Met Met Ile Trp Glu Arg Asn Lys500 505 510Ser Val Ser Pro Thr Val Asn Pro Met Ser Thr Ala Met Gln Asn Glu515 520 525Arg Arg530
<210>113<211>1038<212>PRT<213>Homo sapiens<400>113Met Thr Ser Ser Leu Gln Arg Pro Trp Arg Val Pro Trp Leu Pro Trp1 5 10 15Thr Ile Leu Leu Val Ser Thr Ala Ala Ala Ser Gln Asn Gln Glu Arg20 25 30Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln Asp Leu Gly Ile Gly Glu35 40 45Ser Arg Ile Ser His Glu Asn Gly Thr Ile Leu Cys Ser Lys Gly Ser50 55 60Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys Gly Asp Ile Asn Leu Val65 70 75 80Lys Gln Gly Cys Trp Ser His Ile Gly Asp Pro Gln Glu Cys His Tyr85 90 95Glu Glu Cys Val Val Thr Thr Thr Pro Pro Ser Ile Gln Asn Gly Thr100 105 110Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu Cys Asn Val Asn Phe Thr115 120 125Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro Leu Ser Pro Pro His Ser130 135 140Phe Asn Arg Asp Glu Thr Ile Ile Ile Ala Leu Ala Ser Val Ser Val145 150 155 160Leu Ala Val Leu Ile Val Ala Leu Cys Phe Gly Tyr Arg Met Leu Thr165 170 175Gly Asp Arg Lys Gln Gly Leu His Ser Met Asn Met Met Glu Ala Ala180 185 190Ala Ser Glu Pro Ser Leu Asp Leu Asp Asn Leu Lys Leu Leu Glu Leu195 200 205Ile Gly Arg Gly Arg Tyr Gly Ala Val Tyr Lys Gly Ser Leu Asp Glu210 215 220Arg Pro Val Ala Val Lys Val phe Ser Phe Ala Asn Arg Gln Asn Phe225 230 235 240Ile Asn Glu Lys Asn Ile Tyr Arg Val Pro Leu Met Glu His Asp Asn245 250 255Ile Ala Arg Phe Ile Val Gly Asp Glu Arg Val Thr Ala Asp Gly Arg260 265 270Met Glu Tyr Leu Leu Val Met Glu Tyr Tyr Pro Asn Gly Ser Leu Cys275 280 285Lys Tyr Leu Ser Leu His Thr Ser Asp Trp Val Ser Ser Cys Arg Leu290 295 300Ala His Ser Val Thr Arg Gly Leu Ala Tyr Leu His Thr Glu Leu Pro305 310 315 320Arg Gly Asp His Tyr Lys Pro Ala Ile Ser His Arg Asp Leu Asn Ser325 330 335Arg Asn Val Leu Val Lys Asn Asp Gly Thr Cys Val Ile Ser Asp Phe340 345 350Gly Leu Ser Met Arg Leu Thr Gly Asn Arg Leu Val Arg Pro Gly Glu355 360 365Glu Asp Asn Ala Ala Ile Ser Glu Val Gly Thr Ile Arg Tyr Met Ala370 375 380Pro Glu Val Leu Glu Gly Ala Val Asn Leu Arg Asp Cys Glu Ser Ala385 390 395 400Leu Lys Gln Val Asp Met Tyr Ala Leu Gly Leu Ile Tyr Trp Glu Ile
405 410 415Phe Met Arg Cys Thr Asp Leu Phe Pro Gly Glu Ser Val Pro Glu Tyr420 425 430Gln Met Ala Phe Gln Thr Glu Val Gly Asn His Pro Thr Phe Glu Asp435 440 445Met Gln Val Leu Val Ser Arg Glu Lys Gln Arg Pro Lys Phe Pro Glu450 455 460Ala Trp Lys Glu Asn Ser Leu Ala Val Arg Ser Leu Lys Glu Thr Ile465 470 475 480Glu Asp Cys Trp Asp Gln Asp Ala Glu Ala Arg Leu Thr Ala Gln Cys485 490 495Ala Glu Glu Arg Met Ala Glu Leu Met Met Ile Trp Glu Arg Asn Lys500 505 510Ser Val Ser Pro Thr Val Asn Pro Met Ser Thr Ala Met Gln Asn Glu515 520 525Arg Asn Leu Ser His Asn Arg Arg Val Pro Lys Ile Gly Pro Tyr Pro530 535 540Asp Tyr Ser Ser Ser Ser Tyr Ile Glu Asp Ser Ile His His Thr Asp545 550 555 560Ser Ile Val Lys Asn Ile Ser Ser Glu His Ser Met Ser Ser Thr Pro565 570 575Leu Thr Ile Gly Glu Lys Asn Arg Asn Ser Ile Asn Tyr Glu Arg Gln580 585 590Gln Ala Gln Ala Arg Ile Pro Ser Pro Glu Thr Ser Val Thr Ser Leu595 600 605Ser Thr Asn Thr Thr Thr Thr Asn Thr Thr Gly Leu Thr Pro Ser Thr610 615 620Gly Met Thr Thr Ile Ser Glu Met Pro Tyr Pro Asp Glu Thr Asn Leu625 630 635 640His Thr Thr Asn Val Ala Gln Ser Ile Gly Pro Thr Pro Val Cys Leu645 650 655Gln Leu Thr Glu Glu Asp Leu Glu Thr Asn Lys Leu Asp Pro Lys Glu660 665 670Val Asp Lys Asn Leu Lys Glu Ser Ser Asp Glu Asn Leu Met Glu His675 680 685Ser Leu Lys Gln Phe Ser Gly Pro Asp Pro Leu Ser Ser Thr Ser Ser690 695 700Ser Leu Leu Tyr Pro Leu Ile Lys Leu Ala Val Glu Ala Thr Gly Gln705 710 715 720Gln Asp Phe Thr Gln Thr Ala Asn Gly Gln Ala Cys Leu Ile Pro Asp725 730 735Val Leu Pro Thr Gln Ile Tyr Pro Leu Pro Lys Gln Gln Asn Leu Pro740 745 750Lys Arg Pro Thr Ser Leu Pro Leu Asn Thr Lys Asn Ser Thr Lys Glu755 760 765Pro Arg Leu Lys Phe Gly Ser Lys His Lys Ser Asn Leu Lys Gln Val770 775 780Glu Thr Gly Val Ala Lys Met Asn Thr Ile Asn Ala Ala Glu Pro His785 790 795 800Val Val Thr Val Thr Met Asn Gly Val Ala Gly Arg Asn His Ser Val805 810 815Asn Ser His Ala Ala Thr Thr Gln Tyr Ala Asn Gly Thr Val Leu Ser820 825 830Gly Gln Thr Thr Asn Ile Val Thr His Arg Ala Gln Glu Met Leu Gln835 840 845Asn Gln Phe Ile Gly Glu Asp Thr Arg Leu Asn Ile Asn Ser Ser Pro850 855 860
Asp Glu His Glu Pro Leu Leu Arg Arg Glu Gln Gln Ala Gly His Asp865 870 875 880Glu Gly Val Leu Asp Arg Leu Val Asp Arg Arg Glu Arg Pro Leu Glu885 890 895Gly Gly Arg Thr Asn Ser Asn Asn Asn Asn Ser Asn Pro Cys Ser Glu900 905 910Gln Asp Val Leu Ala Gln Gly Val Pro Ser Thr Ala Ala Asp Pro Gly915 920 925Pro Ser Lys Pro Arg Arg Ala Gln Arg Pro Asn Ser Leu Asp Leu Ser930 935 940Ala Thr Asn Val Leu Asp Gly Ser Ser Ile Gln Ile Gly Glu Ser Thr945 950 955 960Gln Asp Gly Lys Ser Gly Ser Gly Glu Lys Ile Lys Lys Arg Val Lys965 970 975Thr Pro Tyr Ser Leu Lys Arg Trp Arg Pro Ser Thr Trp Val Ile Ser980 985 990Thr Glu Ser Leu Asp Cys Glu Val Asn Asn Asn Gly Ser Asn Arg Ala995 10001005Val His Ser Lys Ser Ser Thr Ala Val Tyr Leu Ala Glu Gly Gly Thr101010151020Ala Thr Thr Met Val Ser Lys Asp Ile Gly Met Asn Cys Leu102510301035<210>114<211>1038<212>PRT<213>Homo sapiens<400>114Met Thr Ser Ser Leu Gln Arg Pro Trp Arg Val Pro Trp Leu Pro Trp1 5 10 15Thr Ile Leu Leu Val Ser Thr Ala Ala Ala Ser Gln Asn Gln Glu Arg20 25 30Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln Asp Leu Gly Ile Gly Glu35 40 45Ser Arg Ile Ser His Glu Asn Gly Thr Ile Leu Cys Ser Lys Gly Ser50 55 60Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys Gly Asp Ile Asn Leu Val65 70 75 80Lys Gln Gly Cys Trp Ser His Ile Gly Asp Pro Gln Glu Cys His Tyr85 90 95Glu Glu Cys Val Val Thr Thr Thr Pro Pro Ser Ile Gln Asn Gly Thr100 105 110Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu Cys Asn Val Asn Phe Thr115 120 125Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro Leu Ser Pro Pro His Ser130 135 140Phe Asn Arg Asp Glu Thr Ile Ile Ile Ala Leu Ala Ser Val Ser Val145 150 155 160Leu Ala Val Leu Ile Val Ala Leu Cys Phe Gly Tyr Arg Met Leu Thr165 170 175Gly Asp Arg Lys Gln Gly Leu His Ser Met Asn Met Met Glu Ala Ala180 185 190Ala Ser Glu Pro Ser Leu Asp Leu Asp Asn Leu Lys Leu Leu Glu Leu195 200 205Ile Gly Arg Gly Arg Tyr Gly Ala Val Tyr Lys Gly Ser Leu Asp Glu
210 215 220Arg Pro Val Ala Val Lys Val Phe Ser Phe Ala Asn Arg Gln Asn Phe225 230 235 240Ile Asn Glu Lys Asn Ile Tyr Arg Val Pro Leu Met Glu His Asp Asn245 250 255Ile Ala Arg Phe Ile Val Gly Asp Glu Arg Val Thr Ala Asp Gly Arg260 265 270Met Glu Tyr Leu Leu Val Met Glu Tyr Tyr Pro Asn Gly Ser Leu Cys275 280 285Lys Tyr Leu Ser Leu His Thr Ser Asp Trp Val Ser Ser Cys Arg Leu290 295 300Ala His Ser Val Thr Arg Gly Leu Ala Tyr Leu His Thr Glu Leu Pro305 310 315 320Arg Gly Asp His Tyr Lys Pro Ala Ile Ser His Arg Asp Leu Asn Ser325 330 335Arg Asn Val Leu Val Lys Asn Asp Gly Thr Cys Val Ile Ser Asp Phe340 345 350Gly Leu Ser Met Arg Leu Thr Gly Asn Arg Leu Val Arg Pro Gly Glu355 360 365Glu Asp Asn Ala Ala Ile Ser Glu Val Gly Thr Ile Arg Tyr Met Ala370 375 380Pro Glu Val Leu Glu Gly Ala Val Asn Leu Arg Asp Cys Glu Ser Ala385 390 395 400Leu Lys Gln Val Asp Met Tyr Ala Leu Gly Leu Ile Tyr Trp Glu Ile405 410 415Phe Met Arg Cys Thr Asp Leu Phe Pro Gly Glu Ser Val Pro Glu Tyr420 425 430Gln Met Ala Phe Gln Thr Glu Val Gly Asn His Pro Thr Phe Glu Asp435 440 445Met Gln Val Leu Val Ser Arg Glu Lys Gln Arg Pro Lys Phe Pro Glu450 455 460Ala Trp Lys Glu Asn Ser Leu Ala Val Arg Ser Leu Lys Glu Thr Ile465 470 475 480Glu Asp Cys Trp Asp Gln Asp Ala Glu Ala Arg Leu Thr Ala Gln Cys485 490 495Ala Glu Glu Arg Met Ala Glu Leu Met Met Ile Trp Glu Arg Asn Lys500 505 510Ser Val Ser Pro Thr Val Asn Pro Met Ser Thr Ala Met Gln Asn Glu515 520 525Arg Asn Leu Ser His Asn Arg Arg Val Pro Lys Ile Gly Pro Tyr Pro530 535 540Asp Tyr Ser Ser Ser Ser Tyr Ile Glu Asp Ser Ile His His Thr Asp545 550 555 560Ser Ile Val Lys Asn Ile Ser Ser Glu His Ser Met Ser Ser Thr Pro565 570 575Leu Thr Ile Gly Glu Lys Asn Arg Asn Ser Ile Asn Tyr Glu Arg Gln580 585 590Gln Ala Gln Ala Arg Ile Pro Ser Pro Glu Thr Ser Val Thr Ser Leu595 600 605Ser Thr Asn Thr Thr Thr Thr Asn Thr Thr Gly Leu Thr Pro Ser Thr610 615 620Gly Met Thr Thr Ile Ser Glu Met Pro Tyr Pro Asp Glu Thr Asn Leu625 630 635 640His Thr Thr Asn Val Ala Gln Ser Ile Gly Pro Thr Pro Val Cys Leu645 650 655Gln Leu Thr Glu Glu Asp Leu Glu Thr Asn Lys Leu Asp Pro Lys Glu660 665 670
Val Asp Lys Asn Leu Lys Glu Ser Ser Asp Glu Asn Leu Met Glu His675 680 685Ser Leu Lys Gln Phe Ser Gly Pro Asp Pro Leu Ser Ser Thr Ser Ser690 695 700Ser Leu Leu Tyr Pro Leu Ile Lys Leu Ala Val Glu Ala Thr Gly Gln705 710 715 720Gln Asp Phe Thr Gln Thr Ala Asn Gly Gln Ala Cys Leu Ile Pro Asp725 730 735Val Leu Pro Thr Gln Ile Tyr Pro Leu Pro Lys Gln Gln Asn Leu Pro740 745 750Lys Arg Pro Thr Ser Leu Pro Leu Asn Thr Lys Asn Ser Thr Lys Glu755 760 765Pro Arg Leu Lys Phe Gly Ser Lys His Lys Ser Asn Leu Lys Gln Val770 775 780Glu Thr Gly Val Ala Lys Met Asn Thr Ile Asn Ala Ala Glu Pro His785 790 795 800Val Val Thr Val Thr Met Asn Gly Val Ala Gly Arg Asn His Ser Val805 810 815Asn Ser His Ala Ala Thr Thr Gln Tyr Ala Asn Arg Thr Val Leu Ser820 825 830Gly Gln Thr Thr Asn Ile Val Thr His Arg Ala Gln Glu Met Leu Gln835 840 845Asn Gln Phe Ile Gly Glu Asp Thr Arg Leu Asn Ile Asn Ser Ser Pro850 855 860Asp Glu His Glu Pro Leu Leu Arg Arg Glu Gln Gln Ala Gly His Asp865 870 875 880Glu Gly Val Leu Asp Arg Leu Val Asp Arg Arg Glu Arg Pro Leu Glu885 890 895Gly Gly Arg Thr Asn Ser Asn Asn Asn Asn Ser Asn Pro Cys Ser Glu900 905 910Gln Asp Val Leu Ala Gln Gly Val Pro Ser Thr Ala Ala Asp Pro Gly915 920 925Pro Ser Lys Pro Arg Arg Ala Gln Arg Pro Asn Ser Leu Asp Leu Ser930 935 940Ala Thr Asn Val Leu Asp Gly Ser Ser Ile Gln Ile Gly Glu Ser Thr945 950 955 960Gln Asp Gly Lys Ser Gly Ser Gly Glu Lys Ile Lys Lys Arg Val Lys965 970 975Thr Pro Tyr Ser Leu Lys Arg Trp Arg Pro Ser Thr Trp Val Ile Ser980 985 990Thr Glu Ser Leu Asp Cys Glu Val Asn Asn Asn Gly Ser Asn Arg Ala995 10001005Val His Ser Lys Ser Ser Thr Ala Val Tyr Leu Ala Glu Gly Gly Thr101010151020Ala Thr Thr Met Val Ser Lys Asp Ile Gly Met Asn Cys Leu102510301035<210>115<211>1038<212>PRT<213>Homo sapiens<400>115Met Thr Ser Ser Leu Gln Arg Pro Trp Arg Val Pro Trp Leu Pro Trp1 5 10 15Thr Ile Leu Leu Val Ser Thr Ala Ala Ala Ser Gln Asn Gln Glu Arg
20 25 30Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln Asp Leu Gly Ile Gly Glu35 40 45Ser Arg Ile Ser His Glu Asn Gly Thr Ile Leu Cys Ser Lys Gly Ser50 55 60Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys Gly Asp Ile Asn Leu Val65 70 75 80Lys Gln Gly Cys Trp Ser His Ile Gly Asp Pro Gln Glu Cys His Tyr85 90 95Glu Glu Cys Val Val Thr Thr Thr Pro Pro Ser Ile Gln Asn Gly Thr100 105 110Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu Cys Asn Val Asn Phe Thr115 120 125Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro Leu Ser Pro Pro His Ser130 135 140Phe Asn Arg Asp Glu Thr Ile Ile Ile Ala Leu Ala Ser Val Ser Val145 150 155 160Leu Ala Val Leu Ile Val Ala Leu Cys Phe Gly Tyr Arg Met Leu Thr165 170 175Gly Asp Arg Lys Gln Gly Leu His Ser Met Asn Met Met Glu Ala Ala180 185 190Ala Ser Glu Pro Ser Leu Asp Leu Asp Asn Leu Lys Leu Leu Glu Leu195 200 205Ile Gly Arg Gly Arg Tyr Gly Ala Val Tyr Lys Gly Ser Leu Asp Glu210 215 220Arg Pro Val Ala Val Lys Val Phe Ser Phe Ala Asn Arg Gln Asn Phe225 230 235 240Ile Asn Glu Lys Asn Ile Tyr Arg Val Pro Leu Met Glu His Asp Asn245 250 255Ile Ala Arg Phe Ile Val Gly Asp Glu Arg Val Thr Ala Asp Gly Arg260 265 270Met Glu Tyr Leu Leu Val Met Glu Tyr Tyr Pro Asn Gly Ser Leu Cys275 280 285Lys Tyr Leu Ser Leu His Thr Ser Asp Trp Val Ser Ser Cys Arg Leu290 295 300Ala His Ser Val Thr Arg Gly Leu Ala Tyr Leu His Thr Glu Leu Pro305 310 315 320Arg Gly Asp His Tyr Lys Pro Ala Ile Ser His Arg Asp Leu Asn Ser325 330 335Arg Asn Val Leu Val Lys Asn Asp Gly Thr Cys Val Ile Ser Asp Phe340 345 350Gly Leu Ser Met Arg Leu Thr Gly Asn Arg Leu Val Arg Pro Gly Glu355 360 365Glu Asp Asn Ala Ala Ile Ser Glu Val Gly Thr Ile Arg Tyr Met Ala370 375 380Pro Glu Val Leu Glu Gly Ala Val Asn Leu Arg Asp Cys Glu Ser Ala385 390 395 400Leu Lys Gln Val Asp Met Tyr Ala Leu Gly Leu Ile Tyr Trp Glu Ile405 410 415Phe Met Arg Cys Thr Asp Leu Phe Pro Gly Glu Ser Val Pro Glu Tyr420 425 430Gln Met Ala Phe Gln Thr Glu Val Gly Asn His Pro Thr Phe Glu Asp435 440 445Met Gln Val Leu Val Ser Arg Glu Lys Gln Arg Pro Lys Phe Pro Glu450 455 460Ala Trp Lys Glu Asn Ser Leu Ala Val Arg Ser Leu Lys Glu Thr Ile465 470 475 480
Glu Asp Cys Trp Asp Gln Asp Ala Glu Ala Arg Leu Thr Ala Gln Cys485 490 495Ala Glu Glu Arg Met Ala Glu Leu Met Met Ile Trp Glu Arg Asn Lys500 505 510Ser Val Ser Pro Thr Val Asn Pro Met Ser Thr Ala Met Gln Asn Glu515 520 525Arg Asn Leu Ser His Asn Arg Arg Val Pro Lys Ile Gly Pro Tyr Pro530 535 540Asp Tyr Ser Ser Ser Ser Tyr Ile Glu Asp Ser Ile His His Thr Asp545 550 555 560Ser Ile Val Lys Asn Ile Ser Ser Glu His Ser Met Ser Ser Thr Pro565 570 575Leu Thr Ile Gly Glu Lys Asn Arg Asn Ser Ile Asn Tyr Glu Arg Gln580 585 590Gln Ala Gln Ala Arg Ile Pro Ser Pro Glu Thr Ser Val Thr Ser Leu595 600 605Ser Thr Asn Thr Thr Thr Thr Asn Thr Thr Gly Leu Thr Pro Ser Thr610 615 620Gly Met Thr Thr Ile Ser Glu Met Pro Tyr Pro Asp Glu Thr Asn Leu625 630 635 640His Thr Thr Asn Val Ala Gln Ser Ile Gly Pro Thr Pro Val Cys Leu645 650 655Gln Leu Thr Glu Glu Asp Leu Glu Thr Asn Lys Leu Asp Pro Lys Glu660 665 670Val Asp Lys Asn Leu Lys Glu Ser Ser Asp Glu Asn Leu Met Glu His675 680 685Ser Leu Lys Gln Phe Ser Gly Pro Asp Pro Leu Ser Ser Thr Ser Ser690 695 700Ser Leu Leu Tyr Pro Leu Ile Lys Leu Ala Val Glu Ala Thr Gly Gln705 710 715 720Gln Asp Phe Thr Gln Thr Ala Asn Gly Gln Ala Cys Leu Ile Pro Asp725 730 735Val Leu Pro Thr Gln Ile Tyr Pro Leu Pro Lys Gln Gln Asn Leu Pro740 745 750Lys Arg Pro Thr Ser Leu Pro Leu Asn Thr Lys Asn Ser Thr Lys Glu755 760 765Pro Arg Leu Lys Phe Gly Ser Lys His Lys Ser Asn Leu Lys Gln Val770 775 780Glu Thr Gly Val Ala Lys Met Asn Thr Ile Asn Ala Ala Glu Pro His785 790 795 800Val Val Thr Val Thr Met Asn Gly Val Ala Gly Arg Asn His Ser Val805 810 815Asn Ser His Ala Ala Thr Thr Gln Tyr Ala Asn Arg Thr Val Leu Ser820 825 830Gly Gln Thr Thr Asn Ile Val Thr His Arg Ala Gln Glu Met Leu Gln835 840 845Asn Gln Phe Ile Gly Glu Asp Thr Arg Leu Asn Ile Asn Ser Ser Pro850 855 860Asp Glu His Glu Pro Leu Leu Arg Arg Glu Gln Gln Ala Gly His Asp865 870 875 880Glu Gly Val Leu Asp Arg Leu Val Asp Arg Arg Glu Arg Pro Leu Glu885 890 895Gly Gly Arg Thr Asn Ser Asn Asn Asn Asn Ser Asn Pro Cys Ser Glu900 905 910Gln Asp Val Leu Ala Gln Gly Val Pro Ser Thr Ala Ala Asp Pro Gly915 920 925Pro Ser Lys Pro Arg Arg Ala Gln Arg Pro Asn Ser Leu Asp Leu Ser
930 935 940Ala Thr Asn Val Leu Asp Gly Ser Ser Ile Gln Ile Gly Glu Ser Thr945 950 955 960Gln Asp Gly Lys Ser Gly Ser Gly Glu Lys Ile Lys Lys Arg Val Lys965 970 975Thr Pro Tyr Ser Leu Lys Arg Trp Arg Pro Ser Thr Trp Val Ile Ser980 985 990Thr Glu Ser Leu Asp Cys Glu Val Asn Asn Asn Gly Ser Asn Arg Ala995 10001005Val His Ser Lys Ser Ser Thr Ala Val Tyr Leu Ala Glu Gly Gly Thr101010151020Ala Thr Thr Met Val Ser Lys Asp Ile Gly Met Asn Cys Leu102510301035<210>116<211>2932<212>DNA<213>Homo sapiens<400>116gctccgcgcc gagggctgga ggatgcgttc cctggggtcc ggacttatga aaatatgcat 60cagtttaata ctgtcttgga attcatgaga tggaagcata ggtcaaagct gtttggagaa 120aatcagaagt acagttttat ctagccacat cttggaggag tcgtaagaaa gcagtgggag 180ttgaagtcat tgtcaagtgc ttgcgatctt ttacaagaaa atctcactga atgatagtca 240tttaaattgg tgaagtagca agaccaatta ttaaaggtga cagtacacag gaaacattac 300aattgaacaa tgactcagct atacatttac atcagattat tgggagccta tttgttcatc 360atttctcgtg ttcaaggaca gaatctggat agtatgcttc atggcactgg gatgaaatca 420gactccgacc agaaaaagtc agaaaatgga gtaaccttag caccagagga taccttgcct 480tttttaaagt gctattgctc agggcactgt ccagatgatg ctattaataa cacatgcata 540actaatggac attgctttgc catcatagaa gaagatgacc agggagaaac cacattagct 600tcagggtgta tgaaatatga aggatctgat tttcagtgca aagattctcc aaaagcccag 660ctacgccgga caatagaatg ttgtcggacc aatttatgta accagtattt gcaacccaca 720ctgccccctg ttgtcatagg tccgtttttt gatggcagca ttcgatggct ggttttgctc 780atttctatgg ctgtctgcat aattgctatg atcatcttct ccagctgctt ttgttacaaa 840cattattgca agagcatctc aagcagacgt cgttacaatc gtgatttgga acaggatgaa 900gcatttattc cagttggaga atcactaaaa gaccttattg accagtcaca aagttctggt 960agtgggtctg gactaccttt attggttcag cgaactattg ccaaacagat tcagatggtc 1020cggcaagttg gtaaaggccg atatggagaa gtatggatgg gcaaatggcg tggcgaaaaa 1080gtggcggtga aagtattctt taccactgaa gaagccagct ggtttcgaga aacagaaatc 1140taccaaactg tgctaatgcg ccatgaaaac atacttggtt tcatagcggc agacattaaa 1200ggtacaggtt cctggactca gctctatttg attactgatt accatgaaaa tggatctctc 1260tatgacttcc tgaaatgtgc tacactggac accagagccc tgcttaaatt ggcttattca 1320gctgcctgtg gtctgtgcca cctgcacaca gaaatttatg gcacccaagg aaagcccgca 1380attgctcatc gagacctaaa gagcaaaaac atcctcatca agaaaaatgg gagttgctgc 1440attgctgacc tgggccttgc tgttaaattc aacagtgaca caaatgaagt tgatgtgccc 1500ttgaatacca gggtgggcac caaacgctac atggctcccg aagtgctgga cgaaagcctg 1560aacaaaaacc acttccagcc ctacatcatg gctgacatct acagcttcgg cctaatcatt 1620tgggagatgg ctcgtcgttg tatcacagga gggatcgtgg aagaatacca attgccatat 1680tacaacatgg taccgagtga tccgtcatac gaagatatgc gtgaggttgt gtgtgtcaaa 1740cgtttgcggc caattgtgtc taatcggtgg aacagtgatg aatgtctacg agcagttttg 1800aagctaatgt cagaatgctg ggcccacaat ccagcctcca gactcacagc attgagaatt 1860aagaagacgc ttgccaagat ggttgaatcc caagatgtaa aaatctgatg gttaaaccat 1920cggaggagaa actctagact gcaagaactg tttttaccca tggcatgggt ggaattagag 1980tggaataagg atgttaactt ggttctcaga ctctttcttc actacgtgtt cacaggctgc 2040taatattaaa cctttcagta ctcttattag gatacaagct gggaacttct aaacacttca 2100ttctttatat atggacagct ttattttaaa tgtggttttt gatgcctttt tttaagtggg 2160tttttatgaa ctgcatcaag acttcaatcc tgattagtgt ctccagtcaa gctctgggta 2220
ctgaattgcc tgttcataaa acggtgcttt ctgtgaaagc cttaagaaga taaatgagcg 2280cagcagagat ggagaaatag actttgcctt ttacctgaga cattcagttc gtttgtattc 2340tacctttgta aaacagccta tagatgatga tgtgtttggg atactgctta ttttatgata 2400gtttgtcctg tgtccttagt gatgtgtgtg tgtctccatg cacatgcacg ccgggattcc 2460tctgctgcca tttgaattag aagaaaataa tttatatgca tgcacaggaa gatattggtg 2520gccggtggtt ttgtgcttta aaaatgcaat atctgaccaa gattcgccaa tctcatacaa 2580gccatttact ttgcaagtga gatagcttcc ccaccagctt tattttttaa catgaaagct 2640gatgccaagg ccaaaagaag tttaaagcat ctgtaaattt ggactgtttt ccttcaacca 2700ccattttttt tgtggttatt atttttgtca cggaaagcat cctctccaaa gttggagctt 2760ctattgccat gaaccatgct tacaaagaaa gcacttctta ttgaagtgaa ttcctgcatt 2820tgatagcaat gtaagtgcct ataaccatgt tctatattct ttattctcag taacttttaa 2880aagggaagtt atttatattt tgtgtataat gtgctttatt tgcaaatcac cc 2932<210>117<211>1575<212>DNA<213>Homo sapiens<400>117gcaaacttcc ttgataacat gcttttgcga agtgcaggaa aattaaatgt gggcaccaag 60aaagaggatg gtgagagtac agcccccacc ccccgtccaa aggtcttgcg ttgtaaatgc 120caccaccatt gtccagaaga ctcagtcaac aatatttgca gcacagacgg atattgtttc 180acgatgatag aagaggatga ctctgggttg cctgtggtca cttctggttg cctaggacta 240gaaggctcag attttcagtg tcgggacact cccattcctc atcaaagaag atcaattgaa 300tgctgcacag aaaggaacga atgtaataaa gacctacacc ctacactgcc tccattgaaa 360aacagagatt ttgttgatgg acctatacac cacagggctt tacttatatc tgtgactgtc 420tgtagtttgc tcttggtcct tatcatatta ttttgttact tccggtataa aagacaagaa 480accagacctc gatacagcat tgggttagaa caggatgaaa cttacsttcc tcctggagaa 540tccctgagag acttaattga gcagtctcag agctcaggaa gtggatcagg cctccctctg 600ctggtccaaa ggactatagc taagcagatt cagatggtga aacagattgg aaaaggtcgc 660tatggggaag tttggatggg aaagtggcgt ggcgaaaagg tagctgtgaa agtgttcttc 720accacagagg aagccagctg gttcagagag acagaaatat atcagacagt gttgatgagg 780catgaaaaca ttttgggttt cattgctgca gatatcaaag ggacagggtc ctggacccag 840ttgtacctaa tcacagacta tcatgaaaat ggttcccttt atgattatct gaagtccacc 900accctagacg ctaaatcaat gctgaagtta gcctactctt ctgtcagtgg cttatgtcat 960ttacacacag aaatctttag tactcaaggc aaaccagcaa ttgcccatcg agatctgaaa 1020agtaaaaaca ttctggtgaa gaaaaatgga acttgctgta ttgctgacct gggcctggct 1080gttaaattta ttagtgatac aaatgaagtt gacataccac ctaacactcg agttggcacc 1140aaacgctata tgcctccaga agtgttggac gagagcttga acagaaatca cttccagtct 1200tacatcatgg ctgacatgta tagttttggc ctcatccttt gggaggttgc taggagatgt 1260gtatcaggag gtatagtgga agaataccag cttccttatc atgacctagt gcccagtgac 1320ccctcttatg aggacatgag ggagattgtg tgcatcaaga agttacgccc ctcattccca 1380aaccggtgga gcagtgatga gtgtctaagg cagatgggaa aactcatgac agaatgctgg 1440gctcacaatc ctgcatcaag gctgacagcc ctgcgggtta agaaaacact tgccaaaatg 1500tcagagtccc aggacattaa actctgatag gagaggaaaa gtaagcatct ctgcagaaag 1560ccaacaggta ccctt 1575<210>118<211>2032<212>DNA<213>Homo sapiens<400>118cgcggggcgc ggagtcggcg gggcctcgcg ggacgcgggc agtgcggaga ccgcggcgct 60gaggacgcgg gagccgggag cgcacgcgcg gggtggagtt cagcctactc tttcttagat 120gtgaaaggaa aggaagatca tttcatgcct tgttgataaa ggttcagact tctgctgatt 180cataaccatt tggctctgag ctatgacaag agaggaaaca aaaagttaaa cttacaagcc 240
tgccataagt gagaagcaaa cttccttgat aacatgcttt tgcgaagtgc aggaaaatta 300aatgtgggca ccaagaaaga ggatggtgag agtacagccc ccaccccccg tccaaaggtc 360ttgcgttgta aatgccacca ccattgtcca gaagactcag tcaacaatat ttgcagcaca 420gacggatatt gtttcacgat gatagaagag gatgactctg ggttgcctgt ggtcacttct 480ggttgcctag gactagaagg ctcagatttt cagtgtcggg acactcccat tcctcatcaa 540agaagatcaa ttgaatgctg cacagaaagg aacgaatgta ataaagacct acaccctaca 600ctgcctccat tgaaaaacag agattttgtt gatggaccta tacaccacag ggctttactt 660atatctgtga ctgtctgtag tttgctcttg gtccttatca tattattttg ttacttccgg 720tataaaagac aagaaaccag acctcgatac agcattgggt tagaacagga tgaaacttac 780attcctcctg gagaatccct gagagactta attgagcagt ctcagagctc aggaagtgga 840tcaggcctcc ctctgctggt ccaaaggact atagctaagc agattcagat ggtgaaacag 900attggaaaag gtcgctatgg ggaagtttgg atgggaaagt ggcgtggcga aaaggtagct 960gtgaaagtgt tcttcaccac agaggaagcc agctggttca gagagacaga aatatatcag 1020acagtgttga tgaggcatga aaacattttg ggtttcattg ctgcagatat caaagggaca 1080gggtcctgga cccagttgta cctaatcaca gactatcatg aaaatggttc cctttatgat 1140tatctgaagt ccaccaccct agacgctaaa tcaatgctga agttagccta ctcttctgtc 1200agtggcttat gtcatttaca cacagaaatc tttagtactc aaggcaaacc agcaattgcc 1260catcgagatc tgaaaagtaa aaacattctg gtgaagaaaa atggaacttg ctgtattgct 1320gacctgggcc tggctgttaa atttattagt gatacaaatg aagttgacat accacctaac 1380actcgagttg gcaccaaacg ctatatgcct ccagaagtgt tggacgagag cttgaacaga 1440aatcacttcc agtcttacat catggctgac atgtatagtt ttggcctcat cctttgggag 1500gttgctagga gatgtgtatc aggaggtata gtggaagaat accagcttcc ttatcatgac 1560ctagtgccca gtgacccctc ttatgaggac atgagggaga ttgtgtgcat caagaagtta 1620cgcccctcat tcccaaaccg gtggagcagt gatgagtgtc taaggcagat gggaaaactc 1680atgacagaat gctgggctca caatcctgca tcaaggctga cagccctgcg ggttaagaaa 1740acacttgcca aaatgtcaga gtcccaggac attaaactct gataggagag gaaaagtaag 1800catctctgca gaaagccaac aggtactctt ctgtttgtgg gcagagcaaa agacatcaaa 1860taagcatcca cagtacaagc cttgaacatc gtcctgcttc ccagtgggtt cagacctcac 1920ctttcaggga gcgacctggg caaagacaga gaagctccca gaaggagaga ttgatccgtg 1980tctgtttgta ggcggagaaa ccgttgggta acttgttcaa gatatgatgc at 2032<210>119<211>3167<212>DNA<213>Rattus sp.
<400>119gaattcatga gatggaaaca taggtcaaag ctgtttggag aaattggaac tacagtttta 60tctagccaca tctctgagaa gtctgaagaa agcagcaggt gaaagtcatt gtcaagtgat 120tttgttcttc tgtaaggaaa cctcgttcag taaggccgtt tacttcagtg aaacagcagg 180accagtaatc aaggtggccc ggacaggaca cgtgcgaatt ggacaatgac tcagctatac 240acttacatca gattactggg agcctgtctg ttcatcattt ctcatgttca acggcagaat 300ctagatagta tgctccatgg tactggtatg aaatcagacg tggaccagaa gaagccggaa 360aatggagtga cgttagcacc agaggacacc ttacctttct taaaatgcta ttgctcagga 420cactgcccag atgacgctat taataacaca tgcataacta atggccattg ctttgccatt 480atagaagaag atgatcaggg agaaaccacg ttaacttctg ggtgtatgaa gtatgaaggc 540tctgattttc aatgcaagga ttcaccaaaa gcccagctac gcaggacaat agaatgttgt 600cggaccaatt tgtgcaacca atatttgcag cctacactgc cccctgtcgt tataggccca 660ttctttgatg gcagcgtccg atggctggct gtgctcatct ctatggctgt ctgtattgtc 720gccatgatcg tcttctccag ctgcttctgt tacaaacatt actgtaagag tatctcaagc 780agaggtcgtt acaaccgtga cttggaacag gatgaagcat ttattccagt aggagaatca 840ctgaaagacc tgattgacca gtcacaaagc tctggtagtg gatctggatt acctttattg 900gttcagcgaa ctattgccaa acagattcag atggttcggc aggttggtaa aggccggtat 960ggagaagtat ggatgggtaa atggcgtggt gaaaaagtgg ctgtcaaagt attttttacc 1020actgaagaag ctagctggtt tagagaaaca gaaatctacc agacggtgtt aatgcgtcat 1080gaaaatatac ttggttttat agctgcagac attaaaggca ccggttcctg gactcagctg 1140tatttgatta ctgattacca tgagaatggg tctctctatg acttcctgaa atgtgccacc 1200
ctggacacca gagccctact caagttagct tattctgctg cctgtggtct gtgccacctc 1260cacacagaaa tttatggcac gcaaggcaag cctgcaattg ctcatcgaga cctgaagagc 1320aaaaacatcc ttattaagaa aaatggtagt tgctgtattg ctgacctggg cctagctgtt 1380aaattcaaca gtgacacaaa tgaagttgac atacccttga acaccagggt gggcaccagg 1440cggtacatgg ctccagaagt gctggacgag agcctgagta aaaaccattt ccagccctac 1500atcatggctg acatctacag ctttggtttg atcatttggg agatggcccg tcgctgtatt 1560acaggaggaa tcgtggagga atatcaatta ccatattaca acatggtgcc tagtgaccca 1620tcttatgaag acatgcgtga ggtcgtgtgt gtgaaacgct tgcggccaat cgtctctaac 1680cgctggaaca gtgatgaatg tcttcgagcc gttttgaagc tgatgtcaga atgctgggcc 1740cataatccag catccagact cacagctttg agaatcaaga agacgctcgc aaagatggtt 1800gaatcccagg atgtaaagat ttgacaaaca gttttgagaa agaatttaga ctgcaagaaa 1860ttcacccgag gaagggtgga gttagcatgg actaggatgt cggcttggtt tccagactct 1920ctcctctaca tcttcacagg ctgctaacag taaactttca ggactctgca gaatgcaggg 1980ttggagcttc agacatagga cttcagacat gctgttcttt gcgtatggac agctttgttt 2040taaatgtggg cttttgatgc ctttttggtt tttatgaatt gcatcaagac tccaatcctg 2100ataagaagtc tctggtcaaa ctctggttac tcactatcct gtccataaag tggtgctttc 2160tgtgaaagcc ttaaggaaat tagtgagctc agcagagatg gagaaaggca tatttgccct 2220ctacagagaa aatatctgtc tgtgttctgt ctctgtaaac agcctggact atgatctctt 2280tgggatgctg cctggttgat gatggtgcat catgcctctg atatgcatac cagacttcct 2340ctgctgccat gggcttacaa gacaagaatg tgaaggttgc acaggacggt atttgtggcc 2400agtggtttaa atatgcaata tctaatcgac attcgccaat ctcataaaag ccatctacct 2460tgtaactgaa gtaacttctc taccaacttt atttttagca taatagttgt aaaggccaaa 2520ctatgtataa agtgtccata gactcgaact gttttcctcc agtcaccatt ttgttttcct 2580tttggtaatt atttttgtta tataattcct cctatccaga attggcgctc actgtcttga 2640accatacttt gaaagaaatg cctcttcctg gagtctgcct tactgcatct gatcaccatg 2700tgcatacctc tgatcaaatt ctggagtctt tgttctcggt acctcttaaa aagggaaatt 2760gtgtatcatg tgtagtgtgc ttttattttc aaaatcttca tagcctttat tctagccatt 2820tttacctaca tactcattct gtacaaaaca gctcactcgg tctcacggct gatcctcagt 2880ggaaatgatt taaagtagag ctgtgtacga atttcagaat tcatgtattt aaaaacttca 2940cactaacact ttactaagat attgtctcat atcttttatg aggatgtcag ctgattttca 3000atgactataa atgtatctta gctatctaaa tcttttgaaa tttggtttta taatttctgg 3060tccctaactt gtgaagacaa agaggcagaa gtacccagtc taccacattt acactgtaca 3120ttattaaata aaaaaatgta tattttaaaa aaaaaaaaaa aaaaaaa 3167<210>120<211>3167<212>DNA<213>Rattus norvegicus<400>120gaattcatga gatggaaaca taggtcaaag ctgtttggag aaattggaac tacagtttta 60tctagccaca tctctgagaa gtctgaagaa agcagcaggt gaaagtcatt gtcaagtgat 120tttgttcttc tgtaaggaaa cctcgttcag taaggccgtt tacttcagtg aaacagcagg 180accagtaatc aaggtggccc ggacaggaca cgtgcgaatt ggacaatgac tcagctatac 240acttacatca gattactggg agcctgtctg ttcatcattt ctcatgttca agggcagaat 300ctagatagta tgctccatgg tactggtatg aaatcagacg tggaccagaa gaagccggaa 360aatggagtga cgttagcacc agaggacacc ttacctttct taaaatgcta ttgctcagga 420cactgcccag atgacgctat taataacaca tgcataacta atggccattg ctttgccatt 480atagaagaag atgatcaggg agaaaccacg ttaacttctg ggtgtatgaa gtatgaaggc 540tctgattttc aatgcaagga ttcaccaaaa gcccagctac gcaggacaat agaatgttgt 600cggaccaatt tgtgcaacca atatttgcag cctacactgc cccctgtcgt tataggccca 660ttctttgatg gcagcgtccg atggctggct gtgctcatct ctatggctgt ctgtattgtc 720gccatgatcg tcttctccag ctgcttctgt tacaaacatt actgtaagag tatctcaagc 780agaggtcgtt acaaccgtga cttggaacag gatgaagcat ttattccagt aggagaatca 840ctgaaagacc tgattgacca gtcacaaagc tctggtagtg gatctggatt acctttattg 900gttcagcgaa ctattgccaa acagattcag atggttcggc aggttggtaa aggccggtat 960ggagaagtat ggatgggtaa atggcgtggt gaaaaagtgg ctgtcaaagt attttttacc 1020
actgaagaag ctagctggtt tagagaaaca gaaatctacc agacggtgtt aatgcgtcat 1080gaaaatatac ttggttttat agctgcagac attaaaggca ccggttcctg gactcagctg 1140tatttgatta ctgattacca tgagaatggg tctctctatg acttcctgaa atgtgccacc 1200ctggacacca gagccctact caagttagct tattctgctg cctgtggtct gtgccacctc 1260cacacagaaa tttatggcac gcaaggcaag cctgcaattg ctcatcgaga cctgaagagc 1320aaaaacatcc ttattaagaa aaatggtagt tgctgtattg ctgacctggg cctagctgtt 1380aaattcaaca gtgacacaaa tgaagttgac atacccttga acaccagggt gggcaccagg 1440cggtacatgg ctccagaagt gctggacgag agcctgagta aaaaccattt ccagccctac 1500atcatggctg acatctacag ctttggtttg atcatttggg agatggcccg tcgctgtatt 1560acaggaggaa tcgtggagga atatcaatta ccatattaca acatggtgcc tagtgaccca 1620tcttatgaag acatgcgtga ggtcgtgtgt gtgaaacgct tgcggccaat cgtctctaac 1680cgctggaaca gtgatgaatg tcttcgagcc gttttgaagc tgatgtcaga atgctgggcc 1740cataatccag catccagact cacagctttg agaatcaaga agacgctcgc aaagatggtt 1800gaatcccagg atgtaaagat ttgacaaaca gttttgagaa agaatttaga ctgcaagaaa 1860ttcacccgag gaagggtgga gttagcatgg actaggatgt cggcttggtt tccagactct 1920ctcctctaca tcttcacagg ctgctaacag taaactttca ggactctgca gaatgcaggg 1980ttggagcttc agacatagga cttcagacat gctgttcttt gcgtatggac agctttgttt 2040taaatgtggg cttttgatgc ctttttggtt tttatgaatt gcatcaagac tccaatcctg 2100ataagaagtc tctggtcaaa ctctggttac tcactatcct gtccataaag tggtgctttc 2160tgtgaaagcc ttaaggaaat tagtgagctc agcagagatg gagaaaggca tatttgccct 2220ctacagagaa aatatctgtc tgtgttctgt ctctgtaaac agcctggact atgatctctt 2280tgggatgctg cctggttgat gatggtgcat catgcctctg atatgcatac cagacttcct 2340ctgctgccat gggcttacaa gacaagaatg tgaaggttgc acaggacggt atttgtggcc 2400agtggtttaa atatgcaata tctaatcgac attcgccaat ctcataaaag ccatctacct 2460tgtaactgaa gtaacttctc taccaacttt atttttagca taatagttgt aaaggccaaa 2520ctatgtataa agtgtccata gactcgaact gttttcctcc agtcaccatt ttgttttcct 2580tttggtaatt atttttgtta tataattcct cctatccaga attggcgctc actgtcttga 2640accatacttt gaaagaaatg cctcttcctg gagtctgcct tactgcatct gatcaccatg 2700tgcatacctc tgatcaaatt ctggagtctt tgttctcggt acctcttaaa aagggaaatt 2760gtgtatcatg tgtagtgtgc ttttattttc aaaatcttca tagcctttat tctagccatt 2820tttacctaca tactcattct gtacaaaaca gctcactcgg tctcacggct gatcctcagt 2880ggaaatgatt taaagtagag ctgtgtacga atttcagaat tcatgtattt aaaaacttca 2940cactaacact ttactaagat attgtctcat atcttttatg aggatgtcag ctgattttca 3000atgactataa atgtatctta gctatctaaa tcttttgaaa tttggtttta taatttctgg 3060tccctaactt gtgaagacaa agaggcagaa gtacccagtc taccacattt acactgtaca 3120ttattaaata aaaaaatgta tattttaaaa aaaaaaaaaa aaaaaaa 3167<210>121<211>3003<212>DNA<213>Rattus norvegicus<400>121cgttcagtaa ggccgtttac ttcagtgaaa cagcaggacc agtaatcaag gtggcccgga 60caggacacgt gcgaattgga caatgactca gctatacact tacatcagat tactgggagc 120ctgtctgttc atcatttctc atgttcaagg gcagaatcta gatagtatgc tccatggtac 180tggtatgaaa tcagacgtgg accagaagaa gccggaaaat ggagtgacgt tagcaccaga 240ggacacctta cctttcttaa aatgctattg ctcaggacac tgcccagatg acgctattaa 300taacacatgc ataactaatg gccattgctt tgccattata gaagaagatg atcagggaga 360aaccacgtta acttctgggt gtatgaagta tgaaggctct gattttcaat gcaaggattc 420accaaaagcc cagctacgca ggacaataga atgttgtcgg accaatttgt gcaaccaata 480tttgcagcct acactgcccc ctgtcgttat aggcccattc tttgatggca gcgtccgatg 540gctggctgtg ctcatctcta tggctgtctg tattgtcgcc atgatcgtct tctccagctg 600cttctgttac aaacattact gtaagagtat ctcaagcaga ggtcgttaca accgtgactt 660ggaacaggat gaagcattta ttccagtagg agaatcactg aaagacctga ttgaccagtc 720acaaagctct ggtagtggat ctggattacc tttattggtt cagcgaacta ttgccaaaca 780gattcagatg gttcggcagg ttggtaaagg ccggtatgga gaagtatgga tgggtaaatg 840
gcgtggtgaa aaagtggctg tcaaagtatt ttttaccact gaagaagcta gctggtttag 900agaaacagaa atctaccaga cggtgttaat gcgtcatgaa aatatacttg gttttatagc 960tgcagacatt aaaggcaccg gttcctggac tcagctgtat ttgattactg attaccatga 1020gaatgggtct ctctatgact tcctgaaatg tgccaccctg gacaccagag ccctactcaa 1080gttagcttat tctgctgcct gtggtctgtg ccacctccac acagaaattt atggcacgca 1140aggcaagcct gcaattgctc atcgagacct gaagagcaaa aacatcctta ttaagaaaaa 1200tggtagttgc tgtattgctg acctgggcct agctgttaaa ttcaacagtg acacaaatga 1260agttgacata cccttgaaca ccagggtggg caccaggcgg tacatggctc cagaagtgct 1320ggacgagagc ctgagtaaaa accatttcca gccctacatc atggctgaca tctacagctt 1380tggtttgatc atttgggaga tggcccgtcg ctgtattaca ggaggaatcg tggaggaata 1440tcaattacca tattacaaca tggtgcctag tgacccatct tatgaagaca tgcgtgaggt 1500cgtgtgtgtg aaacgcttgc ggccaatcgt ctctaaccgc tggaacagtg atgaatgtct 1560tcgagccgtt ttgaagctga tgtcagaatg ctgggcccat aatccagcat ccagactcac 1620agctttgaga atcaagaaga cgctcgcaaa gatggttgaa tcccaggatg taaagatttg 1680acaaacagtt ttgagaaaga atttagactg caagaaattc acccgaggaa gggtggagtt 1740agcatggact aggatgtcgg cttggtttcc agactctctc ctctacatct tcacaggctg 1800ctaacagtaa actttcagga ctctgcagaa tgcagggttg gagcttcaga cataggactt 1860cagacatgct gttctttgcg tatggacagc tttgttttaa atgtgggctt ttgatgcctt 1920tttggttttt atgaattgca tcaagactcc aatcctgata agaagtctct ggtcaaactc 1980tggttactca ctatcctgtc cataaagtgg tgctttctgt gaaagcctta aggaaattag 2040tgagctcagc agagatggag aaaggcatat ttgccctcta cagagaaaat atctgtctgt 2100gttctgtctc tgtaaacagc ctggactatg atctctttgg gatgctgcct ggttgatgat 2160ggtgcatcat gcctctgata tgcataccag acttcctctg ctgccatggg cttacaagac 2220aagaatgtga aggttgcaca ggacggtatt tgtggccagt ggtttaaata tgcaatatct 2280aatcgacatt cgccaatctc ataaaagcca tctaccttgt aactgaagta acttctctac 2340caactttatt tttagcataa tagttgtaaa ggccaaacta tgtataaagt gtccatagac 2400tcgaactgtt ttcctccagt caccattttg ttttcctttt ggtaattatt tttgttatat 2460aattcctcct atccagaatt ggcgctcact gtcttgaacc atactttgaa agaaatgcct 2520cttcctggag tctgccttac tgcatctgat caccatgtgc atacctctga tcaaattctg 2580gagtctttgt tctcggtacc tcttaaaaag ggaaattgtg tatcatgtgt agtgtgcttt 2640tattttcaaa atcttcatag cctttattct agccattttt acctacatac tcattctgta 2700caaaacagct cactcggtct cacggctgat cctcagtgga aatgatttaa agtagagctg 2760tgtacgaatt tcagaattca tgtatttaaa aacttcacac taacacttta ctaagatatt 2820gtctcatatc ttttatgagg atgtcagctg attttcaatg actataaatg tatcttagct 2880atctaaatct tttgaaattt ggttttataa tttctggtcc ctaacttgtg aagacaaaga 2940ggcagaagta cccagtctac cacatttaca ctgtacatta ttaaataaaa aaatgtatat 3000ttt 3003<210>122<211>2063<212>DNA<213>Homo sapiens<400>122gaattccggt gatgatgatg gtgatggtga tgatggtgat gaggatgatg gtgatgatga 60tgatggtgtt ggtgatggtt tttgcatctt ccattcatga actaagtact cttattagtg 120aatttctttt ctttgccctc ctgattcttg gctggcccag ggatgacttc ctcgctgcag 180cggccctggc gggtgccctg gctaccatgg accatcctgc tggtcagcac tgcggctgct 240tcgcagaatc aagaacggct atgtgcgttt aaagatccgt atcagcaaga ccttgggata 300ggtgagagta gaatctctca tgaaaatggg acaatattat gctcgaaagg tagcacctgc 360tatggccttt gggagaaatc aaaaggggac ataaatcttg taaaacaagg atgttggtct 420cacattggag atccccaaga gtgtcactat gaagaatgtg tagtaactac cactcctccc 480tcaattcaga atggaacata ccgtttctgc tgttgtagca cagatttatg taatgtcaac 540tttactgaga attttccacc tcctgacaca acaccactca gtccacctca ttcatttaac 600cgagatgaga caataatcat tgctttggca tcagtctctg tattagctgt tttgatagtt 660gccttatgct ttggatacag aatgttgaca ggagaccgta aacaaggtct tcacagtatg 720aacatgatgg aggcagcagc atccgaaccc tctcttgatc tagataatct gaaactgttg 780
gagctgattg gccgaggtcg atatggagca gtatataaag gctccttgga tgagcgtcca 840gttgctgtaa aagtgttttc ctttgcaaac cgtcagaatt ttatcaacga aaagaacatt 900tacagagtgc ctttgatgga acatgacaac attgcccgct ttatagttgg agatgagaga 960gtcactgcag atggacgcat ggaatatttg cttgtgatgg agtactatcc caatggatct 1020ttatgcaagt atttaagtct ccacacaagt gactgggtaa gctcttgccg tcttgctcat 1080tctgttacta gaggactggc ttatcttcac acagaattac cacgaggaga tcattataaa 1140cctgcaattt cccatcgaga tttaaacagc agaaatgtcc tagtgaaaaa tgatggaacc 1200tgtgttatta gtgactttgg actgtccatg aggctgactg gaaatagact ggtgcgccca 1260ggggaggaag ataatgcagc cataagcgag gttggcacta tcagatatat ggcaccagaa 1320gtgctagaag gagctgtgaa cttgagggac tgtgaatcag ctttgaaaca agtagacatg 1380tatgctcttg gactaatcta ttgggagata tttatgagat gtacagacct cttcccaggg 1440gaatccgtac cagagtacca gatggctttt cagacagagg ttggaaacca tcccactttt 1500gaggatatgc aggttctcgt gtctagggaa aaacagagac ccaagttccc agaagcctgg 1560aaagaaaata gcctggcagt gaggtcactc aaggagacaa tcgaagactg ttgggaccag 1620gatgcagagg ctcggcttac tgcacagtgt gctgaggaaa ggatggctga acttatgatg 1680atttgggaaa gaaacaaatc tgtgagccca acagtcaatc caatgtctac tgctatgcag 1740aatgaacgta ggtgagtcaa cacaagatgg caaatcagga tcaggtgaaa agatcaagaa 1800acgtgtgaaa actccctatt ctcttaagcg gtggcgcccc tccacctggg tcatctccac 1860tgaatcgctg gactgtgaag tcaacaataa tggcagtaac agggcagttc attccaaatc 1920cagcactgct gtttaccttg cagaaggagg cactgctaca accatggtgt ctaaagatat 1980aggaatgaac tgtctgtgaa atgttttcaa gcctatggag tgaaattatt ttttgcatca 2040tttaaacatg cagaagatgt tta 2063<210>123<211>1964<212>DNA<213>Homo sapiens<400>123atttcttttc tttgccctcc tgattcttgg ctggcccagg gatgacttcc tcgctgcagc 60ggccctggcg ggtgccctgg ctaccatgga ccatcctgct ggtcagcact gcggctgctt 120cgcagaatca agaacggcta tgtgcgttta aagatccgta tcagcaagac cttgggatag 180gtgagagtag aatctctcat gaaaatggga caatattatg ctcgaaaggt agcacctgct 240atggcctttg ggagaaatca aaaggggaca taaatcttgt aaaacaagga tgttggtctc 300acattggaga tccccaagag tgtcactatg aagaatgtgt agtaactacc actcctccct 360caattcagaa tggaacatac cgtttctgct gttgtagcac agatttatgt aatgtcaact 420ttactgagaa ttttccacct cctgacacaa caccactcag tccacctcat tcatttaacc 480gagatgagac aataatcatt gctttggcat cagtctctgt attagctgtt ttgatagttg 540ccttatgctt tggatacaga atgttgacag gagaccgtaa acaaggtctt cacagtatga 600acatgatgga ggcagcagca tccgaaccct ctcttgatct agataatctg aaactgttgg 660agctgattgg ccgaggtcga tatggagcag tatataaagg ctccttggat gagcgtccag 720ttgctgtaaa agtgttttcc tttgcaaacc gtcagaattt tatcaacgaa aagaacattt 780acagagtgcc tttgatggaa catgacaaca ttgcccgctt tatagttgga gatgagagag 840tcactgcaga tggacgcatg gaatatttgc ttgtgatgga gtactatccc aatggatctt 900tatgcaagta tttaagtctc cacacaagtg actgggtaag ctcttgccgt cttgctcatt 960ctgttactag aggactggct tatcttcaca cagaattacc acgaggagat cattataaac 1020ctgcaatttc ccatcgagat ttaaacagca gaaatgtcct agtgaaaaat gatggaacct 1080gtgttattag tgactttgga ctgtccatga ggctgactgg aaatagactg gtgcgcccag 1140gggaggaaga taatgcagcc ataagcgagg ttggcactat cagatatatg gcaccagaag 1200tgctagaagg agctgtgaac ttgagggact gtgaatcagc tttgaaacaa gtagacatgt 1260atgctcttgg actaatctat tgggagatat ttatgagatg tacagacctc ttcccagggg 1320aatccgtacc agagtaccag atggcttttc agacagaggt tggaaaccat cccacttttg 1380aggatatgca ggttctcgtg tctagggaaa aacagagacc caagttccca gaagcctgga 1440aagaaaatag cctggcagtg aggtcactca aggagacaat cgaagactgt tgggaccagg 1500atgcagaggc tcggcttact gcacagtgtg ctgaggaaag gatggctgaa cttatgatga 1560tttgggaaag aaacaaatct gtgagcccaa cagtcaatcc aatgtctact gctatgcaga 1620atgaacgtag gtgagtcaac acaagatggc aaatcaggat caggtgaaaa gatcaagaaa 1680
cgtgtgaaaa ctccctattc tcttaagcgg tggcgcccct ccacctgggt catctccact 1740gaatcgctgg actgtgaagt caacaataat ggcagtaaca gggcagttca ttccaaatcc 1800agcactgctg tttaccttgc agaaggaggc actgctacaa ccatggtgtc taaagatata 1860ggaatgaact gtctgtgaaa tgttttcaag cctatggagt gaaattattt tttgcatcat 1920ttaaacatgc agaagatgtt taaaaataaa aaaaaaactg cttt 1964<210>124<211>3611<212>DNA<213>Homo sapiens<400>124cgccccccga ccccggatcg aatccccgcc ctccgcaccc tggatatgtt ttctcccaga 60cctggatatt tttttgatat cgtgaaacta cgagggaaat aatttggggg atttcttctt 120ggctccctgc tttccccaca gacatgcctt ccgtttggag ggccgcggca ccccgtccga 180ggcgaaggaa cccccccagc cgcgagggag agaaatgaag ggaatttctg cagcggcatg 240aaagctctgc agctaggtcc tctcatcagc catttgtcct ttcaaactgt attgtgatac 300gggcaggatc agtccacggg agagaagacg agcctcccgg ctgtttctcc gccggtctac 360ttcccatatt tcttttcttt gccctcctga ttcttggctg gcccagggat gacttcctcg 420ctgcagcggc cctggcgggt gccctggcta ccatggacca tcctgctggt cagcactgcg 480gctgcttcgc agaatcaaga acggctatgt gcgtttaaag atccgtatca gcaagacctt 540gggataggtg agagtagaat ctctcatgaa aatgggacaa tattatgctc gaaaggtagc 600acctgctatg gcctttggga gaaatcaaaa ggggacataa atcttgtaaa acaaggatgt 660tggtctcaca ttggagatcc ccaagagtgt cactatgaag aatgtgtagt aactaccact 720cctccctcaa ttcagaatgg aacataccgt ttctgctgtt gtagcacaga tttatgtaat 780gtcaacttta ctgagaattt tccacctcct gacacaacac cactcagtcc acctcattca 840tttaaccgag atgagacaat aatcattgct ttggcatcag tctctgtatt agctgttttg 900atagttgcct tatgctttgg atacagaatg ttgacaggag accgtaaaca aggtcttcac 960agtatgaaca tgatggaggc agcagcatcc gaaccctctc ttgatctaga taatctgaaa 1020ctgttggagc tgattggccg aggtcgatat ggagcagtat ataaaggctc cttggatgag 1080cgtccagttg ctgtaaaagt gttttccttt gcaaaccgtc agaattttat caacgaaaag 1140aacatttaca gagtgccttt gatggaacat gacaacattg cccgctttat agttggagat 1200gagagagtca ctgcagatgg acgcatggaa tatttgcttg tgatggagta ctatcccaat 1260ggatctttat gcaagtattt aagtctccac acaagtgact gggtaagctc ttgccgtctt 1320gctcattctg ttactagagg actggcttat cttcacacag aattaccacg aggagatcat 1380tataaacctg caatttccca tcgagattta aacagcagaa atgtcctagt gaaaaatgat 1440ggaacctgtg ttattagtga ctttggactg tccatgaggc tgactggaaa tagactggtg 1500cgcccagggg aggaagataa tgcagccata agcgaggttg gcactatcag atatatggca 1560ccagaagtgc tagaaggagc tgtgaacttg agggactgtg aatcagcttt gaaacaagta 1620gacatgtatg ctcttggact aatctattgg gagatattta tgagatgtac agacctcttc 1680ccaggggaat ccgtaccaga gtaccagatg gcttttcaga cagaggttgg aaaccatccc 1740acttttgagg atatgcaggt tctcgtgtct agggaaaaac agagacccaa gttcccagaa 1800gcctggaaag aaaatagcct ggcagtgagg tcactcaagg agacaatcga agactgttgg 1860gaccaggatg cagaggctcg gcttactgca cagtgtgctg aggaaaggat ggctgaactt 1920atgatgattt gggaaagaaa caaatctgtg agcccaacag tcaatccaat gtctactgct 1980atgcagaatg aacgcaacct gtcacataat aggcgtgtgc caaaaattgg tccttatcca 2040gattattctt cctcctcata cattgaagac tctatccatc atactgacag catcgtgaag 2100aatatttcct ctgagcattc tatgtccagc acacctttga ctatagggga aaaaaaccga 2160aattcaatta actatgaacg acagcaagca caagctcgaa tccccagccc tgaaacaagt 2220gtcaccagcc tctccaccaa cacaacaacc acaaacacca caggactcac gccaagtact 2280ggcatgacta ctatatctga gatgccatac ccagatgaaa caaatctgca taccacaaat 2340gttgcacagt caattgggcc aacccctgtc tgcttacagc tgacagaaga agacttggaa 2400accaacaagc tagacccaaa agaagttgat aagaacctca aggaaagctc tgatgagaat 2460ctcatggagc actctcttaa acagttcagt ggcccagacc cactgagcag tactagttct 2520agcttgcttt acccactcat aaaacttgca gtagaagcaa ctggacagca ggacttcaca 2580cagactgcaa atggccaagc atgtttgatt cctgatgttc tgcctactca gatctatcct 2640ctccccaagc agcagaacct tcccaagaga cctactagtt tgcctttgaa caccaaaaat 2700
tcaacaaaag agccccggct aaaatttggc agcaagcaca aatcaaactt gaaacaagtc 2760gaaactggag ttgccaagat gaatacaatc aatgcagcag aacctcatgt ggtgacagtc 2820accatgaatg gtgtggcagg tagaaaccac agtgttaact cccatgctgc cacaacccaa 2880tatgccaatg ggacagtact atctggccaa acaaccaaca tagtgacaca tagggcccaa 2940gaaatgttgc agaatcagtt tattggtgag gacacccggc tgaatattaa ttccagtcct 3000gatgagcatg agcctttact gagacgagag caacaagctg gccatgatga aggtgttctg 3060gatcgtcttg tggacaggag ggaacggcca ctagaaggtg gccgaactaa ttccaataac 3120aacaacagca atccatgttc agaacaagat gttcttgcac agggtgttcc aagcacagca 3180gcagatcctg ggccatcaaa gcccagaaga gcacagaggc ctaattctct ggatctttca 3240gccacaaatg tcctggatgg cagcagtata cagataggtg agtcaacaca agatggcaaa 3300tcaggatcag gtgaaaagat caagaaacgt gtgaaaactc cctattctct taagcggtgg 3360cgcccctcca cctgggtcat ctccactgaa tcgctggact gtgaagtcaa caataatggc 3420agtaacaggg cagttcattc caaatccagc actgctgttt accttgcaga aggaggcact 3480gctacaacca tggtgtctaa agatatagga atgaactgtc tgtgaaatgt tttcaagcct 3540atggagtgaa attatttttt gcatcattta aacatgcaga agatgtttaa aaataaaaaa 3600aaaactgctt t 3611<210>125<211>3871<212>DNA<213>Homo sapiens<400>125ggcctccgca ccctggatat gttttctccc agacctggat atttttttga tatcgtgaaa 60ctacgaggga aataatttgg gggatttctt cttggctccc tgctttcccc acagacatac 120cttccgtttg gagggccgcg gcaccccgtc cgaggcgaag gaaccccccc atccgcgagg 180gagagaaatg aagggaattt ctgcagcggc atgaaagctc tgcagctagg tcctctcatc 240agccatttgt cctttcaaac tgtattgtga tacgggcagg atcagtccac gggagagaag 300acgagcctcc cggctgtttc tccgccggtc tacttcccat atttcttttc tttgccctcc 360tgattcttgg ctggcccagg gatgacttcc tcgctgcagc ggccctggcg ggtgccctgg 420ctaccatgga ccatcctgct ggtcagcact gcggctgctt cgcagaatca agaacggcta 480tgtgcgttta aagatccgta tcagcaagac cttgggatag gtgagagtag aatctctcat 540gaaaatggga caatattatg ctcgaaaggt agcacctgct atggcctttg ggagaaatca 600aaaggggaca taaatcttgt aaaacaagga tgttggtctc acattggaga tccccaagag 660tgtcactatg aagaatgtgt agtaactacc actcctccct caattcagaa tggaacatac 720cgtttctgct gttgtagcac agatttatgt aatgtcaact ttactgagaa ttttccacct 780cctgacacaa caccactcag tccacctcat tcatttaacc gagatgagac aataatcatt 840gctttggcat cagtctctgt attagctgtt ttgatagttg ccttatgctt tggatacaga 900atgttgacag gagaccgtaa acaaggtctt cacagtatga acatgatgga ggcagcagca 960tccgaaccct ctcttgatct agataatctg aaactgttgg agctgattgg ccgaggtcga 1020tatggagcag tatataaagg ctccttggat gagcgtccag ttgctgtaaa agtgttttcc 1080tttgcaaacc gtcagaattt tatcaacgaa aagaacattt acagagtgcc tttgatggaa 1140catgacaaca ttgcccgctt tatagttgga gatgagagag tcactgcaga tggacgcatg 1200gaatatttgc ttgtgatgga gtactatccc aatggatctt tatgcaagta tttaagtctc 1260cacacaagtg actgggtaag ctcttgccgt cttgctcatt ctgttactag aggactggct 1320tatcttcaca cagaattacc acgaggagat cattataaac ctgcaatttc ccatcgagat 1380ttaaacagca gaaatgtcct agtgaaaaat gatggaacct gtgttattag tgactttgga 1440ctgtccatga ggctgactgg aaatagactg gtgcgcccag gggaggaaga taatgcagcc 1500ataagcgagg ttggcactat cagatatatg gcaccagaag tgctagaagg agctgtgaac 1560ttgagggact gtgaatcagc tttgaaacaa gtagacatgt atgctcttgg actaatctat 1620tgggagatat ttatgagatg tacagacctc ttcccagggg aatccgtacc agagtaccag 1680atggcttttc agacagaggt tggaaaccat cccacttttg aggatatgca ggttctcgtg 1740tctagggaaa aacagagacc caagttccca gaagcctgga aagaaaatag cctggcagtg 1800aggtcactca aggagacaat cgaagactgt tgggaccagg atgcagaggc tcggcttact 1860gcacagtgtg ctgaggaaag gatggctgaa cttatgatga tttgggaaag aaacaaatct 1920gtgagcccaa cagtcaatcc aatgtctact gctatgcaga atgaacgcaa cctgtcacat 1980aataggcgtg tgccaaaaat tggtccttat ccagattatt cttcctcctc atacattgaa 2040
gactctatcc atcatactga cagcatcgtg aagaatattt cctctgagca ttctatgtcc 2100agcacacctt tgactatagg ggaaaaaaac cgaaattcaa ttaactatga acgacagcaa 2160gcacaagctc gaatccccag ccctgaaaca agtgtcacca gcctctccac caacacaaca 2220accacaaaca ccacaggact cacgccaagt actggcatga ctactatatc tgagatgcca 2280tacccagatg aaacaaatct gGataccaca aatgttgcac agtcaattgg gccaacccct 2340gtctgcttac agctgacaga agaagacttg gaaaccaaca agctagaccc aaaagaagtt 2400gataagaacc tcaaggaaag ctctgatgag aatctcatgg agcactctct taaacagttc 2460agtggcccag acccactgag cagtactagt tctagcttgc tttacccact cataaaactt 2520gcagtagaag caactggaca gcaggacttc acacagactg caaatggcca agcatgtttg 2580attcctgatg ttctgcctac tcagatctat cctctcccca agcagcagaa ccttcccaag 2640agacctacta gtttgccttt gaacaccaaa aattcaacaa aagagccccg gctaaaattt 2700ggcagcaagc acaaatcaaa cttgaaacaa gtcgaaactg gagttgccaa gatgaataca 2760atcaatgcag cagaacctca tgtggtgaca gtcaccatga atggtgtggc aggtagaaac 2820cacagtgtta actcccatgc tgccacaacc caatatgcca ataggacagt actatctggc 2880caaacaacca acatagtgac acatagggcc caagaaatgt tgcagaatca gtttattggt 2940gaggacaccc ggctgaatat taattccagt cctgatgagc atgagccttt actgagacga 3000gagcaacaag ctggccatga tgaaggtgtt ctggatcgtc ttgtggacag gagggaacgg 3060ccactagaag gtggccgaac taattccaat aacaacaaca gcaatccatg ttcagaacaa 3120gatgttcttg cacagggtgt tccaagcaca gcagcagatc ctgggccatc aaagcccaga 3180agagcacaga ggcctaattc tctggatctt tcagccacaa atgtcctgga tggcagcagt 3240atacagatag gtgagtcaac acaagatggc aaatcaggat caggtgaaaa gatcaagaaa 3300cgtgtgaaaa ctccctattc tcttaagcgg tggcgcccct ccacctgggt catctccact 3360gaatcgctgg actgtgaagt caacaataat gccagtaaca gggcagttca ttccaaatcc 3420agcactgctg tttaccttgc agaaggaggc actgctacaa ccatggtgtc taaagatata 3480ggaatgaact gtctgtgaaa tgttttcaag cctatggagt gaaattattt tttgcatcat 3540ttaaacatgc agaagatgtt taccgggcgg ggtgacagga gagagcgtca gcggcaagct 3600gtggaggatg gggctcagaa tgcagacctg ggctggccgc atggcctctc cctgagccct 3660gatttgtggt agggaagcag tatgggtgca gtcccctcct aggcctccct ctggggtccc 3720ccgatcctat cccacctctt cagggtgagc cagcctcacc tcttcctagt cctgagggtg 3780agggcaggct gaggcaacga gtgggaggtt caaacaagag tgggctggag ccaagggaaa 3840atagagatga tgtaatttct ttccggaatt c3871<210>126<211>88<212>PRT<213>Homo sapiens<400>126Cys Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg1 5 10 15Ser Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro20 25 30Ala Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro35 40 45Ser Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg50 55 60Val Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val65 70 75 80Arg Leu Val Ala Ser Cys Lys Cys85<210>127<211>82<212>PRT<213>Homo sapiens
<400>127Cys Arg Pro Ile Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro1 5 10 15Val Cys Ile Thr Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr20 25 30Met Thr Arg Val Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val35 40 45Cys Asn Tyr Arg Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys50 55 60Pro Arg Gly Val Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys65 70 75 80Gln Cys<210>128<211>82<212>PRT<213>Homo sapiens<400>128Cys Glu Leu Thr Asn Ile Thr Ile Ala Ile Glu Lys Glu Glu Cys Arg1 5 10 15Phe Cys Ile Ser Ile Asn Thr Thr Trp Cys Ala Gly Tyr Cys Tyr Thr20 25 30Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys Ile Gln Lys Thr35 40 45Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg Val Pro Gly Cys50 55 60Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val Ala Thr Gln Cys65 70 75 80His Cys<210>129<211>84<212>PRT<213>Homo sapiens<400>129Cys Ile Pro Thr Glu Tyr Thr Met His Ile Glu Arg Arg Glu Cys Ala1 5 10 15Tyr Cys Leu Thr Ile Asn Thr Thr Ile Cys Ala Gly Tyr Cys Met Thr20 25 30Arg Asp Ile Asn Gly Lys Leu Phe Leu Pro Lys Tyr Ala Leu Ser Gln35 40 45Asp Val Cys Thr Tyr Arg Asp Phe Ile Tyr Arg Thr Val Glu Ile Pro50 55 60Gly Cys Pro Leu His Val Ala Pro Tyr Phe Ser Tyr Pro Val Ala Leu65 70 75 80Ser Cys Lys Cys<210>130<211>83
<212>PRT<213>Homo sapiens<400>130Cys Asn Asp Ile Thr Ala Arg Leu Gln Tyr Val Lys Val Gly Ser Cys1 5 10 15Lys Ser Glu Val Glu Val Asp Ile His Tyr Cys Gln Gly Lys Cys Ala20 25 30Ser Lys Ala Met Tyr Ser Ile Asp Ile Asn Asp Val Gln Asp Gln Cys35 40 45Ser Cys Cys Ser Pro Thr Arg Thr Glu Pro Met Gln Val Ala Leu His50 55 60Cys Thr Asn Gly Ser Val Val Tyr His Glu Val Leu Asn Ala Met Glu65 70 75 80Cys Lys Cys<210>131<211>80<212>PRT<213>Homo sapiens<400>131Cys Ser Thr Val Pro Val Thr Thr Glu Val Ser Tyr Ala Gly Cys Thr1 5 10 15Lys Thr Val Leu Met Asn His Cys Ser Gly Ser Cys Gly Thr Phe Val20 25 30Met Tyr Ser Ala Lys Ala Gln Ala Leu Asp His Ser Cys Ser Cys Cys35 40 45Lys Glu Glu Lys Thr Ser Gln Arg Glu Val Val Leu Ser Cys Pro Asn50 55 60Gly Gly Ser Leu Thr His Thr Tyr Thr His Ile Glu Ser Cys Gln Cys65 70 75 80<210>132<211>80<212>PRT<213>Homo sapiens<400>132Cys Arg Thr Val Pro Phe Ser Gln Thr Ile Thr His Glu Gly Cys Glu1 5 10 15Lys Val Val Val Gln Asn Asn Leu Cys Phe Gly Lys Cys Gly Ser Val20 25 30His Phe Pro Gly Ala Ala Gln His Ser His Thr Ser Cys Ser His Cys35 40 45Leu Pro Ala Lys Phe Thr Thr Met His Leu Pro Leu Asn Cys Thr Glu50 55 60Leu Ser Ser Val Ile Lys Val Val Met Leu Val Glu Glu Cys Gln Cys65 70 75 80<210>133<211>85<212>PRT
<213>Homo sapiens<400>133Cys Lys Thr Gln Pro Leu Lys Gln Thr Ile His Glu Glu Gly Cys Asn1 5 10 15Ser Arg Thr Ile Ile Asn Arg Phe Cys Tyr Gly Gln Cys Asn Ser Phe20 25 30Tyr Ile Pro Arg His Ile Arg Lys Glu Glu Gly Ser Phe Gln Ser Cys35 40 45Ser Phe Cys Lys Pro Lys Lys Phe Thr Thr Met Met Val Thr Leu Asn50 55 60Cys Pro Glu Leu Gln Pro Pro Thr Lys Lys Lys Arg Val Thr Arg Val65 70 75 80Lys Gln Cys Arg Cys85<210>134<211>86<212>PRT<213>Homo sapiens<400>134Cys Glu Ala Lys Asn Ile Thr Gln Ile Val Gly His Ser Gly Cys Glu1 5 10 15Ala Lys Ser Ile Gln Asn Arg Ala Cys Leu Gly Gln Cys Phe Ser Tyr20 25 30Ser Val Pro Asn Thr Phe Pro Gln Ser Thr Glu Ser Leu Val His Cys35 40 45Asp Ser Cys Met Pro Ala Gln Ser Met Trp Glu Ile Val Thr Leu Glu50 55 60Cys Pro Gly His Glu Glu Val Pro Arg Val Asp Lys Leu Val Glu Lys65 70 75 80Ile Leu His Cys Ser Cys85<210>135<211>70<212>PRT<213>Homo sapies<400>135Cys Ile Arg Thr Pro Lys Ile Ser Lys Pro Ile Lys Phe Glu Leu Ser1 5 10 15Gly Cys Thr Ser Met Lys Thr Tyr Arg Ala Lys Phe Cys Gly Val Cys20 25 30Thr Asp Gly Arg Cys Cys Thr Pro His Arg Thr Thr Thr Leu Pro Val35 40 45Glu Phe Lys Cys Pro Asp Gly Glu Val Met Lys Lys Asn Met Met Phe50 55 60Ile Lys Thr Cys Ala Cys65 70<210>136<211>70
<212>PRT<213>Homo sapiens<400>136Cys Leu Arg Thr Lys Lys Ser Leu Lys Ala Ile His Leu Gln Phe Lys1 5 10 15Asn Cys Thr Ser Leu His Thr Tyr Lys Pro Arg Phe Cys Gly Val Cys20 25 30Ser Asp Gly Arg Cys Cys Thr Pro His Asn Thr Lys Thr Ile Gln Ala35 40 45Glu Phe Gln Cys Ser Pro Gly Gln Ile Val Lys Lys Pro Val Met Val50 55 60Ile Gly Thr Cys Thr Cys65 70<210>137<211>70<212>PRT<213>Homo sapiens<400>137Cys Ser Lys Thr Lys Lys Ser Pro Glu Pro Val Arg Phe Thr Tyr Ala1 5 10 15Gly Cys Leu Ser Val Lys Lys Tyr Arg Pro Lys Tyr Cys Gly Ser Cys20 25 30Val Asp Gly Arg Cys Cys Thr Pro Gln Leu Thr Arg Thr Val Lys Met35 40 45Arg Phe Arg Cys Glu Asp Gly Glu Thr Phe Ser Lys Asn Val Met Met50 55 60Ile Gln Ser Cys Lys Cys65 70<210>138<211>205<212>PRT<213>Homo sapiens<400>138Gln His Tyr Leu His Ile Arg Pro Ala Pro Ser Asp Asn Leu Pro Leu1 5 10 15Val Asp Leu Ile Glu His Pro Asp Pro Ile Phe Asp Pro Lys Glu Lys20 25 30Asp Leu Asn Glu Thr Leu Leu Arg Ser Leu Leu Gly Gly His Tyr Asp35 40 45Pro Gly Phe Met Ala Thr Ser Pro Pro Glu Asp Arg Pro Gly Gly Gly50 55 60Gly Gly Ala Ala Gly Gly Ala Glu Asp Leu Ala Glu Leu Asp Gln Leu65 70 75 80Leu Arg Gln Arg Pro Ser Gly Ala Met Pro Ser Glu Ile Lys Gly Leu85 90 95Glu Phe Ser Glu Gly Leu Ala Gln Gly Lys Lys Gln Arg Leu Ser Lys100 105 110Lys Leu Arg Arg Lys Leu Gln Met Trp Leu Trp Ser Gln Thr Phe Cys115 120 125Pro Val Leu Tyr Ala Trp Asn Asp Leu Gly Ser Arg Phe Trp Pro Arg
130 135 140Tyr Val Lys Val Gly Ser Cys Phe Ser Lys Arg Ser Cys Ser Val Pro145 150 155 160Glu Gly Met Val Cys Lys Pro Ser Lys Ser Val His Leu Thr Val Leu165 170 175Arg Trp Arg Cys Gln Arg Arg Gly Gly Gln Arg Cys Gly Trp Ile Pro180 185 190Ile Gln Tyr Pro Ile Ile Ser Glu Cys Lys Cys Ser Cys195 200 205<210>139<211>197<212>PRT<213>Gallus gallus<400>139Gln His Tyr Leu His Ile Arg Pro Ala Pro Ser Asp Asn Leu Pro Leu1 5 10 15Val Asp Leu Ile Glu His Pro Asp Pro Ile Phe Asp Pro Lys Glu Lys20 25 30Asp Leu Asn Glu Thr Leu Leu Arg Ser Leu Met Gly Gly His Phe Asp35 40 45Pro Asn Phe Met Ala Met Ser Leu Pro Glu Asp Arg Leu Gly Val Asp50 55 60Asp Leu Ala Glu Leu Asp Leu Leu Leu Arg Gln Arg Pro Ser Gly Ala65 70 75 80Met Pro Gly Glu Ile Lys Gly Leu Glu Phe Tyr Asp Gly Leu Gln Pro85 90 95Gly Lys Lys His Arg Leu Ser Lys Lys Leu Arg Arg Lys Leu Gln Met100 105 110Trp Leu Trp Ser Gln Thr Phe Cys Pro Val Leu Tyr Thr Trp Asn Asp115 120 125Leu Gly Ser Arg Phe Trp Pro Arg Tyr Val Lys Val Gly Ser Cys Tyr130 135 140Ser Lys Arg Ser Cys Ser Val Pro Glu Gly Met Val Cys Lys Pro Ala145 150 155 160Lys Ser Val His Leu Thr Ile Leu Arg Trp Arg Cys Gln Arg Arg Gly165 170 175Gly Gln Arg Cys Thr Trp Ile Pro Ile Gln Tyr Pro IIe IIe AIa GIu180 185 190Cys Lys Cys Ser Cys195<210>140<211>196<212>PRT<213>Xenopus laeVis<400>140Gln His Tyr Leu His Ile Arg Pro Ala Pro Ser Glu Asn Leu Pro Leu1 5 10 15Val Asp Leu Ile Glu His Pro Asp Pro Ile Tyr Asp Pro Lys Glu Lys20 25 30Asp Leu Asn Glu Thr Leu Leu Arg Thr Leu Met Val Gly His Phe Asp35 40 45
Pro Asn Phe Met Ala Thr Ile Leu Pro Glu Glu Arg Leu Gly Val Glu50 55 60Asp Leu Gly Glu Leu Asp Leu Leu Leu Arg Gln Lys Pro Ser Gly Ala65 70 75 80Met Pro Ala Glu Ile Lys Gly Leu Glu Phe Tyr Glu Gly Leu Gln Ser85 90 95Lys Lys His Arg Leu Ser Lys Lys Leu Arg Arg Lys Leu Gln Met Trp100 105 110Leu Trp Ser Gln Thr Phe Cys Pro Val Leu Tyr Thr Trp Asn Asp Leu115 120 125Gly Thr Arg Phe Trp Pro Arg Tyr Val Lys Val Gly Ser Cys Tyr Ser130 135 140Lys Arg Ser Cys Ser Val Pro Glu Gly Met Val Cys Lys Ala Ala Lys145 150 155 160Ser Met His Leu Thr Ile Leu Arg Trp Arg Cys Gln Arg Arg Val Gln165 170 175Gln Lys Cys Ala Trp Ile Thr Ile Gln Tyr Pro Val Ile Ser Glu Cys180 185 190Lys Cys Ser Cys195<210>141<211>195<212>PRT<213>Takifugu rubripes<400>141Gln Pro Tyr Tyr Leu Leu Arg Pro Ile Pro Ser Asp Ser Leu Pro Ile1 5 10 15Val Glu Leu Lys Glu Asp Pro Gly Pro Val Phe Asp Pro Lys Glu Arg20 25 30Asp Leu Asn Glu Thr Glu Leu Lys Ser Val Leu Gly Asp Phe Asp Ser35 40 45Arg Phe Leu Ser Val Leu Pro Pro Ala Glu Asp Gly His Ala Gly Asn50 55 60Asp Glu Leu Asp Asp Phe Asp Ala Gln Arg Trp Gly Gly Ala Leu Pro65 70 75 80Lys Glu Ile Arg Ala Val Asp Phe Asp Ala Pro Gln Leu Gly Lys Lys85 90 95His Lys Pro Ser Lys Lys Leu Lys Arg Arg Leu Gln Gln Trp Leu Trp100 105 110Ala Tyr Ser Phe Cys Pro Leu Ala His Ala Trp Thr Asp Leu Gly Ser115 120 125Arg Phe Trp Pro Arg Phe Val Arg Ala Gly Ser Cys Leu Ser Lys Arg130 135 140Ser Cys Ser Val Pro Glu Gly Met Thr Cys Lys Pro Ala Thr Ser Thr145 150 155 160His Leu Thr Ile Leu Arg Trp Arg Cys Val Gln Arg Lys Val Gly Leu165 170 175Lys Cys Ala Trp Ile Pro Met Gln Tyr Pro Val Ile Thr Asp Cys Lys180 185 190Cys Ser Cys195<210>142
<211>196<212>PRT<213>Danio rerio<400>142Gln His Tyr Tyr Leu Leu Arg Pro Ile Pro Ser Asp Ser Leu Pro Ile1 5 10 15Val Glu Leu Lys Glu Asp Pro Asp Pro Val Leu Asp Pro Lys Glu Arg20 25 30Asp Leu Asn Glu Thr Glu Leu Arg Ala Ile Leu Gly Ser His Phe Glu35 40 45Gln Asn Phe Met Ser Ile Asn Pro Pro Glu Asp Lys His Ala Gly Gln50 55 60Asp Glu Leu Asn Glu Ser Glu Leu Met Lys Gln Arg Pro Asn Gly Ile65 70 75 80Met Pro Lys Glu Ile Lys Ala Met Glu Phe Asp Ile Gln His Gly Lys85 90 95Lys His Lys Pro Ser Lys Lys Leu Arg Arg Arg Leu Gln Leu Trp Leu100 105 110Trp Ser Tyr Thr Phe Cys Pro Val Val His Thr Trp Gln Asp Leu Gly115 120 125Asn Arg Phe Trp Pro Arg Tyr Leu Lys Val Gly Ser Cys Tyr Asn Lys130 135 140Arg Ser Cys Ser Val Pro Glu Gly Met Val Cys Lys Pro Pro Lys Ser145 150 155 160Ser His Leu Thr Val Leu Arg Trp Arg Cys Val Gln Arg Lys Gly Gly165 170 175Leu Lys Cys Ala Trp Ile Pro Val Gln Tyr Pro Val Ile Ser Glu Cys180 185 190Lys Cys Ser Cys195<210>143<211>188<212>PRT<213>Mus musculus<400>143Gln Gly Trp Gln Ala Phe Arg Asn Asp Ala Thr Glu Val Ile Pro Gly1 5 10 15Leu Gly Glu Tyr Pro Glu Pro Pro Pro Glu Asn Asn Gln Thr Met Asn20 25 30Arg Ala Glu Asn Gly Gly Arg Pro Pro His His Pro Tyr Asp Ala Lys35 40 45Gly Val Ser Glu Tyr Ser Cys Arg Glu Leu His Tyr Thr Arg Phe Leu50 55 60Thr Asp Gly Pro Cys Arg Ser Ala Lys Pro Val Thr Glu Leu Val Cys65 70 75 80Ser Gly Gln Cys Gly Pro Ala Arg Leu Leu Pro Asn Ala Ile Gly Arg85 90 95Val Lys Trp Trp Arg Pro Asn Gly Pro Asp Phe Arg Cys Ile Pro Asp100 105 110Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro Gly Gly Ala Ala115 120 125Pro Arg Ser Arg Lys Val Arg Leu Val Ala Ser Cys Lys Cys Lys Arg130 135 140
Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly Pro Glu145 150 155 160Thr Ala Arg Pro Gln Lys Gly Arg Lys Pro Arg Pro Gly Ala Arg Gly165 170 175Ala Lys Ala Asn Gln Ala Glu Leu Glu Asn Ala Tyr180 18权利要求
1.与硬化素多肽特异结合的抗体或其抗原结合片段,所述硬化素多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,其中所述抗体竞争性抑制该硬化素多肽与(i)骨形态发生蛋白(BMP)I型受体结合位点和(ii)BMP II型受体结合位点中至少其一的结合,其中BMP I型受体结合位点能够与包含选自下组的序列中所示的氨基酸序列的BMP I型受体多肽结合GenBank编号NM_004329(SEQ ID NO102)、D89675(SEQ ID NO103)、NM_001203(SEQ ID NO104)、S75359(SEQ ID NO105)、NM_030849(SEQ ID NO106)、D38082(SEQID NO107)、NP_001194(SEQ ID NO108)、BAA19765(SEQ ID NO109)、和AAB33865(SEQ ID NO110),而且其中BMP II型受体结合位点能够与包含选自下组的序列中所示的氨基酸序列的BMP II型受体多肽结合GenBank编号U25110(SEQ ID NO111)、NM_033346(SEQID NO112)、Z48923(SEQ ID NO114)、CAA88759(SEQ ID NO115)、和NM_001204(SEQ ID NO113)。
2.与硬化素多肽特异性结合且削弱硬化素均二聚体形成的抗体或其抗原结合片段,其中所述硬化素多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列。
3.权利要求1或2的抗体,其中所述抗体是多克隆抗体。
4.权利要求1或2的抗体,其中所述抗体是单克隆抗体。
5.权利要求4的抗体,其中所述单克隆抗体选自下组小鼠单克隆抗体、人单克隆抗体、大鼠单克隆抗体、和仓鼠单克隆抗体。
6.生成权利要求4所述抗体的杂交瘤细胞。
7.能够表达权利要求4所述抗体的宿主细胞。
8.权利要求1或2的抗体,其中所述抗体是人源化抗体或嵌合抗体。
9.能够表达权利要求8抗体的宿主细胞。
10.权利要求1或2的抗体,其中所述抗原结合片段选自下组F(ab′)2、Fab′、Fab、Fd、和Fv。
11.权利要求1或2的抗体,其中包含单链抗体。
12.能够表达权利要求11所述抗体的宿主细胞。
13.包含依照权利要求1或2的抗体或其抗原结合片段以及生理学可接受载体的组合物。
14.包含含有SOST多肽的至少21个连续氨基酸且不超过50个连续氨基酸的肽的免疫原,所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,其中所述肽能够在非人动物中引发与SOST多肽特异结合、并竞争性抑制SOST多肽与(i)骨形态发生蛋白(BMP)I型受体结合位点和(ii)BMP II型受体结合位点中至少其一的结合的抗体,其中BMP I型受体结合位点能够与包含选自下组的序列中所示的氨基酸序列的BMP I型受体多肽结合GenBank编号NM_004329(SEQ ID NO102)、D89675(SEQ ID NO103)、NM_001203(SEQ ID NO104)、S75359(SEQ ID NO105)、NM_030849(SEQ IDNO106)、D38082(SEQ ID NO107)、NP_001194(SEQ ID NO108)、BAA19765(SEQ ID NO109)、和AAB33865(SEQ ID NO110),而且其中BMP II型受体结合位点能够与包含选自下组的序列中所示的氨基酸序列的BMP II型受体多肽结合GenBank编号U25110(SEQ ID NO111)、NM_033346(SEQ ID NO112)、Z48923(SEQ ID NO114)、CAA88759(SEQ ID NO115)、和NM_001204(SEQ ID NO113)。
15.包含含有SOST多肽的至少21个连续氨基酸且不超过50个连续氨基酸的肽的免疫原,所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,其中所述肽能够在非人动物中引发与SOST多肽特异结合并削弱硬化素均二聚体形成的抗体。
16.权利要求14或15的免疫原,其中所述肽与载体分子相连。
17.权利要求16的免疫原,其中所述载体分子是载体多肽。
18.权利要求17的免疫原,其中所述载体多肽是匙孔_血蓝蛋白。
19.用于生成与SOST多肽特异结合的抗体的方法,包括用依照权利要求14的免疫原免疫非人动物,其中(a)所述SOST多肽包含SEQ IDNO2、6、8、14、46、或65所示氨基酸序列;(b)所述抗体竞争性抑制SOST多肽与(i)骨形态发生蛋白(BMP)I型受体结合位点和(ii)BMPII型受体结合位点中至少其一的结合;(c)BMP I型受体结合位点能够与包含选自下组的序列中所示的氨基酸序列的BMP I型受体多肽结合GenBank编号NM_004329(SEQ ID NO102)、D89675(SEQ ID NO103)、NM_001203(SEQ ID NO104)、S75359(SEQ ID NO105)、NM_030849(SEQ ID NO106)、D38082(SEQ ID NO107)、NP_001194(SEQ ID NO108)、BAA19765(SEQ ID NO109)、和AAB33865(SEQID NO110);且(d)BMP II型受体结合位点能够与包含选自下组的序列中所示的氨基酸序列的BMP II型受体多肽结合GenBank编号U25110(SEQ ID NO111)、NM_033346(SEQ ID NO112)、Z48923(SEQID NO114)、CAA88759(SEQ ID NO115)、和NM_001204(SEQ ID NO113)。
20.用于生成与SOST多肽特异结合的抗体的方法,所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,该方法包括用依照权利要求15的免疫原免疫非人动物,其中所述抗体可削弱硬化素均二聚体的形成。
全文摘要
本发明公开了TGF-β结合蛋白的新类别或家族。本发明还公开了用于选择可增加骨矿化的分子的测定法以及利用这些分子的方法。具体而言,本发明提供了涉及与TGF-β结合蛋白特异结合的抗体的组合物和方法。这些方法和组合物涉及通过干扰TGF-β结合蛋白硬化素与TGF-β超家族成员特别是骨形态发生蛋白之间的相互作用来改变骨矿物质密度。增加骨矿物质密度对于以骨矿物质密度低为特征的疾病和状况诸如骨质减少、骨质疏松和骨折而言是有用的。
文档编号A61K48/00GK1835968SQ200480023326
公开日2006年9月20日 申请日期2004年6月15日 优先权日2003年6月16日
发明者M·E·布伦考, D·J·加拉斯, B·科瓦切维奇, J·T·马利根, B·W·佩珀, J·范内斯, D·G·温克勒 申请人:细胞技术研究与发展公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1