专利名称:Icam-4及其诊断用途的制作方法
技术领域:
本发明一般涉及细胞粘附分子并具体涉及克隆和表达编码称为“ICAM-4”的迄今仍属未知多肽的DNA,该多肽具有与细胞间粘附分子ICAM-1,ICAM-2和ICAM-R的结构相关性。
背景技术:
最近十年中的研究已清楚阐明了参与体内细胞之间相互作用的分子反应,特别是那些与免疫系统中的细胞运动和激活有关的反应,并且最近,还阐明了与神经系统中细胞的发育和正常生理功能有关的反应。有关免疫系统的细胞,一般请参见Springer,Nature,346425-434(1990),而有关神经系统的细胞请参见Yoshihara等Neurosci.Res.1083-105(1991)和Sondereger与Rathjen,J.Cell Biol.1191387-1397(1992)。细胞表面蛋白,特别是所谓细胞粘附蛋白分子(“CAMs”)已经相应成为药物研究与开发的课题,其目的在于干预白细胞向炎症部位外渗和白细胞向特定靶组织移动的过程以及干预神经分化和复杂的神经回路的形成。细胞粘附分子的分离和表征,编码此类分子的DNA序列的克隆与表达,以及与炎症过程和神经系统的发育及功能相关的治疗与诊断试剂的开发也已经成为许多美国和外国的Letters专利申请的课题。参见Edwards,Current Opinion In Therapeutic Patents,1(11)1617-1630(1991)和本文具体引用的出版物“专利文献参考资料”。
本发明背景的基本兴趣在于事先鉴别和表征细胞粘附反应的某些中介因子“白细胞整联蛋白”,LFA-1,MAC-1和gp150.95(按照世界卫生组织命名法,分别为CD18/CD11a,CD18/CD11b,和CD18/CD11c),它们形成在B淋巴细胞,T淋巴细胞,单核细胞以及粒细胞上出现的异二聚体“整联蛋白”细胞表面蛋白质的一个亚族。例如,参见Springer,出处同上429页的表1。所述兴趣还在于其他单链粘附分子(CAMs),它们已被发现与白细胞激活,粘附,游动性等参与炎症过程的反应有关。例如,目前认为在以炎症过程为特征的白细胞外渗前,在白细胞表面发生整联蛋白组成型表达的激活反应并随后发生整联蛋白(例如,LFA-1)与两种独特的被称为ICAM-1和ICAM-2的细胞间粘附分子(ICAMs)之一或两者之间的紧密配体/受体相互作用,而所述粘附分子是在血管内皮细胞表面和其他白细胞上表达的。
与至今已表征的其他CAMs相类似[例如1990年11月25日发表的PCT WO90/13300中描述的血管粘连蛋白(VCAM-1);以及Newman等在Science,2471219-1222(1990)中和在1991年7月25日发表的PCT WO 91/10683中描述的血小板内皮细胞粘附分子(PECAM-1)],ICAM-1和ICAM-2结构上与免疫球蛋白基因超家族的其他成员有结构同源性,因为其各自的细胞外部分包含了一系列结构域,这些结构域共有一个类似的羧基末段基元。一种“典型的”免疫球蛋白样结构域含一个环式结构,该环式结构通常通过每个环式结构肢端的两个半胱氨酸之间的二硫键锚着。ICAM-1包含五个免疫球蛋白样结构域;与ICAM-1有不同细胞分布的ICAM-2包含两个此类结构域;PECAM-1包含六个结构域;VCAM根据剪接的不同而包含六个或七个结构域等。而且,CAMs一般包含一个疏水“跨膜”区,该区域被认为参与位于细胞表面和羧基末段“细胞质”区域的分子的取向。CAMs的有效布局的图解模式一般表示为跨膜区处的细胞膜中锚着的分子,其细胞质的“尾”伸入到细胞质中,而一个或多个免疫球蛋白样环从细胞表面伸出。
一些神经细胞表达具有细胞外Ig样结构域(结构上类似于ICAMs)的表面受体。例如参见Yoshihara等,出处同上。除了Ig样结构域外,许多神经系统的粘附分子在细胞外结构域中还包含串联重复的纤连蛋白样序列。
已为细胞间粘附分子制定了各种治疗应用计划,包括设想在ICAM-1与人类鼻病毒的结合能力方面的应用。例如,1992年1月29日发表的欧洲专利申请号468 257 A,论述了推测具有增强的配体/受体结合活性,特别是与病毒,抗原相关性淋巴细胞以及如plasmodium falciparum的病原体的结合能力的ICAM-1多聚体构型与形式的开发(包括全长和截短的分子形式)。
以同样的方式,已为免疫学上与细胞间粘附分子相关的蛋白质规划了各种应用。例如1991年11月14日公开的WO91-16928描述了人源化嵌合抗ICAM-1抗体以及它们在治疗特异性和非特异性炎症,病毒感染和哮喘中的应用。在1992年,3月19日公开的WO92/04034中描述了的抗ICAM-1抗体及其片段在治疗内毒素性休克是有用的。在1992年4月16日公开的WO92/06119中描述了用抗ICAM-1的抗独特型抗体及抗体片段抑制ICAM-1依赖型炎症反应。
尽管通过鉴别和表征细胞间粘附蛋白质如ICAM-1和淋巴细胞活性整联蛋白如LFA-1获得了对细胞粘附现象的基本认识,对这种现象的描绘远没有完成。一般认为许多其他蛋白质与炎症过程及遍及全身的导向淋巴细胞移动有关。例如,美国专利申请序号07/827,689,07/889,724,07/894,061和08/009,266和相应发表的PCT申请WO 93/14776(1993年8月5日发表)公开了ICAM-相关性蛋白质(ICAM-R)的克隆与表达。这些申请的公开文献在本文引用为参考,而ICAM-R的DNA序列和氨基酸序列在本文的SEQ ID NO.4中给出。业已发现这种新型配体在人类淋巴细胞,单核细胞和粒细胞上表达。
在本申请特别感兴趣的是,还鉴定了另一种ICAM样表面分子,与任何已知ICAM分子不同的是这种分子表现出组织特异性表达。Mori等[Proc.Natl.Acad.Sci.(USA)843921-3925(1987)]报道了对兔脑中的端脑特异性抗原的鉴定,特别是与单克隆抗体271A6有免疫反应性。这种表面抗原被称为端脑素。Imamura等[Neurosci.Letts.119118-121(1990)]用单克隆抗体测定局部的表达,断定猫的视觉皮质中的端脑素的表达表现出在组织层中的差异,并且还报道了端脑素根据发育功能而有不同表达。Oka等[Neuroscience 3593-103(1990)]随后报道用单克隆抗体271A6分离出端脑素。该出版物报道了一个约500kD的表面分子的分子量,并且所述分子包含四个亚单位,每个亚单位的天然分子量是130kD,而在经过N-聚糖酶处理后分子量约为100kD。Yoshihiro等[Neuroscience,Research Supplement 18,p.S83(1994)]在1993年12月7-9日在日本名古屋的日本神经科学学会第17届年会上并在1993年9月9日华盛顿举行的神经科学学会的第23届年会上报道了兔端脑素的cDNA和氨基酸序列[Sciety for NeuroscienceAbstracts 19(1-3)p.646(1993)]。所报道的推导氨基酸序列提示130kD端脑素是一种膜内在蛋白,其具有九个细胞外免疫球蛋白(Ig)样结构域。这些结构域中远端的八个表现出与其他ICAM Ig-样结构域的同源性。与此相同的资料由Yoshihara等在Neuron12543-553(1994)中报道。
因此,本领域仍需要发现参与人类细胞-细胞相互作用的其他蛋白质,特别是需要具体鉴别和表征此类蛋白质氨基酸序列方面的资料。而且,此类分子可能到了构成开发治疗和诊断试剂之基础的程度,因而有必要阐明编码此类分子的DNA。此类为大规模生产所述蛋白质做准备的创新性资料容许鉴别天然产生所述蛋白质的细胞并以此容许制备抗体物质或其他新的特异反应性结合蛋白质和(或)抑制所述蛋白质参与的配体/受体结合反应。
发明简述作为本发明内容之一,本发明提供纯化的并分离的多核苷酸(例如,DNA序列,RNA转录物及其反义寡核苷酸),所述多核苷酸编码新型多肽“ICAM-4”及其多肽变体(包括片段和缺失,替换,和添加类似物),它们表现出一个或一个以上的对ICAM-4特异的结合生物学活性与(或)免疫学特性。ICAM-4特异的配体/受体结合生物学活性包括ICAM-4细胞外及细胞质结构域与其他分子的相互作用(例如,细胞-细胞粘附与(或)信号转导过程)。优选的本发明DNA序列包括基因组和cDNA序列以及全部或部分化学合成的DNA序列。目前优选的多核苷酸在SEQ ID NO1中给出,而该多核苷酸编码兔物种的ICAM-4。本发明的DNA序列的生物学复本(replica)(即体内或体外产生的分离DNA序列拷贝)是所期望的。本发明还提供自主复制重组结构物如与ICAM-4序列结合的质粒和病毒DNA载体,并特别提供其中编码ICAM-4或ICAM-4变体的DNA被有效连接到一个内源性或外源性控制DNA序列。
本发明的另一方面内容中,用本发明DNA序列以使所需要的蛋白质在其中表达的方式稳定转化宿主细胞(特别是单细胞宿主细胞如原核与真核细胞)。表达此类ICAM-4和ICAM-4变体产物的宿主细胞可用于各种有用的目的。所表达的产物达到“出现”在宿主细胞表面的程度时,该细胞可构成一种有价值的免疫原,所述免疫原用于建立对ICAM-4与ICAM-4变体有特异免疫反应性的抗体物质。本发明的宿主细胞在用于大规模生产ICAM-4和ICAM-4变体的方法中是十分有用的,其中所述细胞被培养在适当的培养基中,而从这些细胞或从培养细胞的培养基中分离所需要的多肽产物。
本发明的新型ICAM-4可由天然细胞来源的分离物而获得,但是,由于伴随着ICAM-4变体,而优选通过本发明宿主细胞有关的重组方法产生。目前优选的ICAM-4多肽的氨基酸序列在SEQ ID NO2中给出。该产物可能以充分或部分糖基化,部分或完全去糖基化,或非糖基化的形式获得,这取决于所选用于产生重组子的宿主细胞和(或)分离后的加工过程。本发明的ICAM-4变体可含水溶性或非水溶性单体,多聚体或环式ICAM-4片段,这些片段包含一个或多个上述指定的结构域的部分并具有ICAM-4的生物学或免疫学特性,例如包括与ICAM-4结合配偶体结合的能力与(或)抑制ICAM-4与天然结合配偶体结合的能力。本发明的ICAM-4变体还可包括多肽类似物,其中一个或多个指定的氨基酸被缺失或被取代(1)无丢失,并优选有所增强对ICAM-4特异的一种或多种生物学活性或免疫学特性;或(2)伴随特异的使具体配体/受体结合功能失效。对包括有利于多聚体形成的其他氨基酸(例如,赖氨酸或半胱氨酸)残基的类似物多肽是所期望的。
本发明还包括抗体物质(例如,单克隆和多克隆抗体,抗体片段,单链抗体,嵌合抗体,互补决定区移植抗体等)和其他结合蛋白质(例如多肽和肽),它们对ICAM-4或ICAM-4变体是特异的(即,与ICAM-4结构相关性ICAM-1,ICAM-2和ICAM-R细胞间粘附分子不发生反应)。本发明还包括杂交瘤细胞系,它们特异性分泌本发明的单克隆抗体。本发明目前优选的杂交瘤包括被称之为127A,127H,173E,179I和179H的杂交瘤。使用分离的天然或重组ICAM-4或ICAM-4变体或细胞,在其表面表达此类产物可产生抗体物质。此外,本发明的结合蛋白质对于表征结合配偶体的结构(例如,抗原表位和/或结合属性对ICAM-4氨基酸序列中的修饰的敏感性)特别有用。
因而结合蛋白质在用于免疫以及纯化本发明多肽和鉴别在其表面出现所述多肽的细胞的组合物中是有用的。它们对调节(即阻断,抑制或刺激)与ICAM-4有关的配体/受体结合生物学活性,特别是对调节参与特异或非特异性免疫系统反应的那些ICAM-4效应器的功能也是明显有用的。对抗-ICAM-4抗体物质有特异性抗独特型抗体以及此类抗独特型抗体物质在调节免疫反应中的使用也是所期望的。本发明进一步提供在一个个体中进行神经病理学筛查的方法,其步骤包括a)从个体获得流体样品;b)使所述样品与ICAM-4特异免疫反应性抗体接触;c)对样品中ICAM-4/抗体的结合水平进行定量;和d)将样品中的ICAM-4/抗体结合水平与已知没有神经病理学现象的个体(对照)中的ICAM-4/抗体结合水平进行比较。例如,用于细胞表面上和体液中(如血清或脑脊液)的ICAM-4检测与定量的测试可包括“三明治”测试形式中的单一抗体物质或多抗体物质。在测定体液中的ICAM-4时,本发明抗体还用于评估与循环的ICAM-4水平增加有关的神经病理学现象的出现。此类神经病理学现象包括(但不限于)由各种失调原因导致的脑局部缺血(即中风),例如包括血栓形成,栓塞,脑动脉瘤出血和血管痉挛等。循环ICAM-4的定量亦可区别癫痫的不同形式并且还可容许确定AIDS病情发展的阶段。循环ICAM-4检测可对诊断有用的其他神经病理学失调症包括各种形式的Alzheimer病和其他脑皮层痴呆(如Pick病,扩散性皮质Lewy体病和额叶退化病),脑皮层下痴呆(包括Parkinson病,Huntington病,和进行性核上病),一些初级神经失调(如抑郁,神经分裂症和神经病),以及非遗传性痴呆,例如产生于感染,脉管炎,代谢性和营养性失调(例如甲状腺,维生素B12缺乏),血管失调(复合梗塞,腔隙状态症,Binswanger病),中毒性脑病(例如一氧化碳,重金属或其他工业污染物中毒)和肿瘤。
通过公开本发明DNA和氨基酸序列所提供的资料的科学价值是明显的。在一系列实例中,ICAM-4的cDNA序列知识使有可能通过编码ICAM-4的基因组DNA序列与具体的ICAM-4表达调控序列,如启动子,操纵子等的DNA/DNA杂交而进行分离。用本发明DNA序列并在严紧条件下实施的DNA/DNA杂交方法同样被期望容许分离编码ICAM-4等位基因变体,分离共用一个或多个ICAM-4特异的生物学与(或)免疫学性质的其他结构相关蛋白质,和分离与其他物种ICAM-4同源的蛋白质。本发明的DNAs在检测细胞合成ICAM-4能力的DNA/RNA杂交测试中是有用的。通过本发明还可利用的是反义多核苷酸,所述反义多核苷酸通过常规表达同样物质的细胞参与调节ICAM-4的表达。在另一系列实例中,ICAM-4的DNA和氨基酸序列的知识通过如杂交融合蛋白(有时被认为是“免疫粘附”)的ICAM-4变体的重组方法使所述生产成为可能,其中所述杂交融合蛋白以ICAM-4蛋白质序列和免疫球蛋白重链恒定区与(或)铰链区的存在为特征。参见Capon等,Nature,337525-531(1989);Ashkenazi等,P.N.A.S(USA),8810535-10539(1991);和1989年4月6日公开的PCT WO89/02922。例如ICAM-4变体融合蛋白还可包括所选的ICAM-4的细胞外结构域和其他细胞粘附分子的部分。
本发明DNA还容许鉴定非翻译DNA序列,所述序列特异性促进有效连接到启动子区的多核苷酸的表达。在某些情况(例如基因转移),此类启动子序列的鉴定和使用是十分需要的,这种情况特别需要在有限的神经环境中的异源基因的表达。本发明还包括含本发明启动子的载体,以及嵌合基因结构,其中本发明启动子与一个异源多核苷酸序列和一个转录终止信号被有效连接。
本发明提供的DNA与氨基酸序列信息使系统分析ICAM-4的结构与功能以及定义在细胞外和细胞内水平的相互作用的分子成为可能。本发明的抗-ICAM-4单克隆抗体的独特型是此类分子的代表并可模拟天然结合蛋白质(肽与多肽),在该过程中ICAM-4细胞间和细胞内的活性受到调节或通过该过程ICAM-4调节细胞间和细胞内的反应。或者,它们可代表ICAM-4活动调节物的新类别。抗-独特型抗体因而可代表生物学活性ICAM-4等价物的新类别。在鉴定抗体或其他调节ICAM-4活动的化合物的体外测试中可包括例如固定化ICAM-4或能与ICAM-4结合的天然配体,检测性标记非固定化结合配偶体,在一起温孵所述结合配偶体并测定检测化合物对标记键数量的影响,其中与无检测化合物的标记键的量比较,有检测化合物时的标记键量的降低表明该检测试剂是ICAM-4结合的抑制剂。
本发明提供的DNA序列资料通过同源重组或“剔除”策略[例如参见Kapecchi,Science,2441288-1292(1989)]也可使开发不能表达有功能的ICAM-4或表达变体ICAM-4蛋白质的啮齿类成为可能。这种啮齿类作为研究ICAM-4和ICAM-4调节物在体内的活动的模型是有用的。
发明详述1993年8月5日提交的美国专利申请序号08/102,852的公开资料具体引用为参考。该申请所述及的实施例特别是设计和构建ICAM相关DNAs之PCR扩增所用的寡核苷酸探针;使用所述探针扩增与编码ICAM-1和ICAM-2同源而又与其不同的人类基因组片段;用所述基因组片段筛选cDNA库以分离另外的ICAM-R编码序列;筛选cDNA库以分离编码ICAM-R的全长人类cDNA序列;表征ICAM-R的DNA和氨基酸序列资料,特别是涉及ICAM-1和ICAM-2的资料;开发表达ICAM-R的哺乳动物宿主细胞;评估ICAM-R参与包括CD18依赖性和CD18-非依赖性途径的粘附反应指标;通过ICAM-R衍生肽抑制细胞与ICAM-R的粘附;表达ICAM-R的变体;制备和表征抗ICAM-R抗体及其片段;绘制抗-ICAM-R单克隆抗体识别的ICAM-R表位图;评估ICAM-R和编码同样物质的RNA的分布与生物化学特征;评估同型细胞-细胞粘附与免疫细胞激活/-增殖中的ICAM-R;表征ICAM-R单克隆抗体;和评估ICAM-R细胞质结构域的差别磷酸化以及细胞骨架关联部分。被公开的还有鉴定啮齿类ICAM编码DNA,其同时似乎是人类ICAM-R的大鼠同源物,并使用这种DNA构建和表达编码谷胱甘肽S转移酶融合蛋白的DNAs。如何鉴定这种啮齿类DNA的详细描述可在实施例6中的母案申请(U.S.S.N.08/102,852)中找到,并在本文如实施例1进行重述。随着更多的啮齿类ICAM编码序列被鉴定,愈加明显知道啮齿类ICAM DNA不编码人类ICAM-R的大鼠物种同系物,而事实上编码新型ICAM多肽,本文称为ICAM-4。为正确评价导致ICAM-4鉴定的事件,在本发明的详细描述后提供了一个年表。
第一个啮齿类基因组ICAM-4序列被鉴定为编码与人类ICAM-R(本文中的SEQ ID NO4)的结构域2(本文的SEQ ID NO3和U.S.S.N.08/102,852的SEQ ID NO23)同源的区域。与基因组DNA(本文的SEQ ID NO5和U.S.S.N.08/102,852的SEQ ID NO26)重叠的第二个序列也被鉴定为编码SEQ ID NO3的结构域2区和ICAM-1的序列。使用SEQ ID NO3作为探针,啮齿类脾cDNA(本文的SEQ ID NO6和U.S.S.N.08/102,852的SEQ ID NO25)被鉴定为编码结构域2到5并且第五个结构域先前并未发现是一个ICAM结构域。此时,这些新鉴定的啮齿类DNAs似乎编码人类ICAM-R的啮齿类同源物,然而,这些DNAs的3’区与其他ICAMs证明难于进行序列对比。
随后从大鼠脾脏库分离1kb cDNA克隆并进行RT-PCR片段扩增表明cDNA与基因组克隆两者均有一部分尚未被测序。另一个RT-PCR扩增产物(SEQ ID NO7)证实了这个疏忽。一个177bp的片段被确定是从基因组和cDNA克隆剪切来的,目的是通过对所述克隆进行EcoRI消化以从DNA测序研究的λ噬菌体分离这些序列。根据这些另外的序列进行的SEQ ID NO5和6的重新分析容许鉴定出最初所分离的基因组和cDNA克隆的更准确和完整的序列,本文修正的形式被描述为SEQ ID NO8和9。
为鉴定ICAM-4的完整编码序列,分离了大鼠脑cDNA(SEQ IDNO10),并通过cDNA末端(5’RACE)的5’快速扩增测定5’末端序列,所述扩增产物在SEQ ID NO11中给出。结合来自RT-PCR克隆(SEQ ID NO7),脑cDNA(SEQ ID NO10)和RACE扩增产物(SEQ ID NO11)的资料容许鉴定出完整的ICAM-4编码序列(SEQID NO1)。
因此,本发明通过下述实施例得到解释。更具体而言,实施例1描述部分啮齿类ICAM-4DNA的克隆过程。实施例2描述啮齿类ICAM-4转录的Northern印迹分析。实施例3描述全长啮齿类ICAM-4cDNA的分离。实施例4涉及啮齿类ICAM-4在脑组织中的原位杂交。实施例5描述在原核生物中产生ICAM-4融合蛋白。实施例6描述ICAM-4/GST融合蛋白特异的单克隆抗体的产生。实施例7描述可溶性大鼠ICAM-4蛋白质在杆状病毒表达系统中的表达。实施例8描述对在杆状病毒系统中表达的大鼠ICAM-4特异的单克隆抗体的产生。实施例9描述大鼠ICAM-4表达的免疫细胞化学分析。实施例10涉及克隆人类基因组ICAM-4-编码DNA。实施例11描述克隆人类ICAM-4编码DNA。实施例12描述人类ICAM-4表达的Northern分析。实施例13描述人类ICAM-4/GST融合蛋白的产生。实施例14描述人类ICAM-4免疫特异性单克隆抗体的产生。实施例15描述测定可溶性ICAM-4在具体流体中浓度的捕捉试验的开发。实施例16在评估中风病人血清中ICAM-4浓度时应用捕捉试验方法。实施例17涉及评估大鼠癫痫模型中的ICAM-4的转录。实施例18描述在评估各种神经退化性失调症时对循环ICAM-4的检测。实施例19描述人类ICAM-4的启动子区的克隆化。
实施例1大鼠ICAM-相关DNA的克隆A.大鼠基因组ICAM相关的结构域2 DNA的分离用通过PCR从编码人ICAM-3结构域2的DNA产生的[32P]标记的探针筛选构建到λEMBL3中的大鼠基因组库。所述探针的序列在SEQID NO12中给出。库的噬斑被转移到Hybond N+尼龙膜上(Amercham,Arlington Heights,IL)。对全部cDNA和基因组库的筛选按照标准方法进行。预杂交和杂交在40-50%甲酰胺,5 X Denhardr’s,5 XSSPE和1.0%SDS溶液中,42℃下进行。探针([32P]标记)以105-106cpm/ml的杂交液浓度被加入。杂交16到18小时后,在室温在含0.1%SDS的2 X SSPE中充分洗涤尼龙膜,随后在-80℃,X光胶片中曝光过夜。阳性噬斑进行一轮以上的杂交以获得克隆噬菌体。从阳性克隆裂解物制备的DNA被亚克隆到pBS+中并测序。
编码大鼠ICAM-相关结构域2的第一个基因组克隆被鉴定确定为与其他ICAM家族成员中的结构域2区域是同源的(例如,参见美国专利申请序号08/102,852的表1),但不同于先前报道的大鼠ICAM-1核苷酸序列[Kita等Biochem.Biophys.Acta,1131108-110(1992)]或小鼠ICAM-2核苷酸序列[Xu等,J.Immunol.1492560-2565(1992)]。所述核酸及推导的该克隆的氨基酸序列在本申请的共同未决母体申请中被公开为大鼠ICAM-R的名义变体的形式并分别在U.S.S.N.08/102,852的SEQ ID NO23和24中给出。此处,这些同样的序列分别在SEQ ID NO3和13中给出。
重叠的第二个克隆亦用同样的探针鉴定并确定含SEQ ID NO3的ICAM结构域2序列和编码至少部分大鼠ICAM-1的5’DNA。这个克隆的核酸序列在本申请的共同未决母体申请中给出为SEQ ID NO26并在本文给出为SEQ ID NO5。这第二个克隆表明了第一个克隆的ICAM相关基因片段和编码大鼠ICAM-1的基因位于同一大鼠染色体相距5kb。
B.大鼠ICAM相关cDNA的分离为鉴定更完整的ICAM相关多肽编码序列,用编码前述A节中鉴定的大鼠基因组克隆之结构域2(SEQ ID NO3)的[32P]标记DNA筛选源于各种大鼠与小鼠细胞类型的一些cDNA库,包括大鼠巨噬细胞(Clontech,Palo Alto,CA),外周血淋巴细胞(PBL)(Clontech),T细胞(自建的),和脾(Clontech)以及小鼠PBL(Clontech),T细胞(内部构建的),B细胞(自建的)。
在一个大鼠脾cDNA库(Clontech)中鉴定了一个单一克隆,其包含了五个Ig样结构域,其中的四个与ICAM-1和ICAM-R的结构域2到5均是同源的。而且,这个克隆包括了编码一个明显第五Ig样结构域的3’DNA,它在先前尚未在任何其他ICAM多肽中被鉴定过。此外,所述克隆含一个少见的3’序列,随后被确定是一个位于结构域4和5之间的部分内含子(下文讨论),因此表明所述克隆是一种未成熟的或异常剪接的转录物。独特的结构域的存在以及3’区与其他已知ICAMs没有适当的可排比性的测定结果提示所述ICAM相关DNA可能编码一种新型大鼠ICAM多肽。这个克隆的核酸序列在本申请的母体申请中给出为SEQ ID NO25;本文所述脾cDNA克隆的核酸序列在SEQ ID NO6中给出。
C.大鼠cDNA与基因组DNAs的再分析继1993年8月5日提交的美国专利申请序号08/102,852之后,据测定,部分大鼠脾cDNA克隆(母体申请中是SEQ ID NO25而本文中是SEQ ID NO6)和大鼠肝基因组克隆(母体申请是SEQ ID NO26而本文中是SEQ ID NO5)丢失了一个内部的177bpEcoRI片段,该片段是这些克隆中每个克隆的一部分,但在所述库的插入片段从EcoRI消化的λ载体移出并连接到测序载体中的亚克隆步骤中丢失了。所述cDNA和基因组克隆可能丢失了一个编码片段的观察结果在进行大鼠基因组和cDNA序列与各种RT-PCR扩增产物(包括SEQ IDNO7)的序列对比时(在大鼠序列中显示出一个缺口)变得明确了。
随后用脾cDNA克隆(SEQ ID NO6)作为探针从脾文库分离和序列对比cDNA提供了所述脾cDNA和基因组克隆的一部分未曾被测序的最初线索。这个想法的进一步确认在使用SEQ ID NO14中给出的5’引物(RRD3 5’Xho,含便利克隆的5’Xhol限制位点)和SEQ IDNO15中给出的3’引物(RRD5 3’Hind,含便利克隆的一个HindIII位点)扩增RT-PCR片段(跨越结构域3到5)时变得明显了。
GAACTCGAGGCCATGCCTCCACTTTCC(SEQ ID NO14)CCATAAGCTTTATTCCACCGTGACAGCCAC(SEQ ID NO15)这两个DNAs的序列对比显示所述cDNA与基因组克隆在测序前已经丢失了一个片段;这个想法在进行下文讨论的RT-PCR DNA测序后得到进一步支持。结论是,在测序之前用EcoRI限制性消化移出cDNA和基因组片段,导致在琼脂糖凝胶分离源于λ噬菌体序列的克隆时肉眼检测不到的177bp片段切除。随后的序列分析证实了在两个原始克隆中两个EcoRI位点旁侧位置有一个177bp片段。
所述177bpEcoRI片段位于大鼠部分cDNA克隆的719和896核苷酸之间如SEQ ID NO9中给出的,并位于部分基因组克隆中的2812和2989核苷酸之间,如SEQ ID NO8中给出的。
D.通过RT-PCR克隆分离的DNART-PCR被用于产生大鼠ICAM相关基因的更完整的序列资料。所述基因组克隆的序列资料(SEQ ID NO3)被用于设计与所述蛋白质编码区5’区域互补的有义引物(如从cDNA克隆所确定的),而设计的反义引物与编码序列和所述cDNA克隆中编码序列3’区(SEQ IDNO6)互补。
PCR反应的模板cDNA按下述方法制备。从大鼠脾细胞分离的约2微克polyA+RNA在10微升体积中通过65℃加热变性。变性后,加入0.1微升RNasin(Invitrogen,San Diego,CA),5微升5 X RTase缓冲液(BRL,Bethesda,MD),2微升随机六聚体(pd(N)6 100微克/毫升)(Pharmacia,Piscataway,NJ),6微升dNTPs(每种2mM)和2微升AMV RTase(BRL)并在42℃温孵反应60-90分钟。反应物被储存在-20℃直到需要使用时。
进行最初的一系列实验以鉴定寡核苷酸引物对,所述引物对用大鼠脾cDNA作为模板在PCR中产生扩增产物。各种5’有义引物在PCR中与3’引物配对,后者被设计成与内部,编码序列互补;所述3’引物被命名为RRD2 3-1并在SEQ ID NO16中给出。
AACGTGCGGAGCTGTCTG (SEQ ID NO16)(在最终分离的RT-PCR产物中(下述SEQ ID NO7)引物RRD2 3-1对应于核苷酸719到736)。同样,各种3’反义引物与5’引物配对,后者被设计为与另外的内部,编码序列互补;在这些反应中的5’引物被命名为RGen3900S并在SEQ ID NO17中给出。
ACGGAATTCGAAGCCATCAACGCCAGG (SEQ ID NO17)(在下述SEQ ID NO7中,引物RGen 3900S对应于核苷酸1719到1736)。根据扩增产物的大小以及这些产物与部分cDNA克隆杂交的能力,一对引物被测定为最有效的并在随后的PCR扩增中使用。所述5’引物被命名为RGen 780S(SEQ ID NO18),而所述3’引物被命名为RGen4550AS(SEQ ID NO19)。
CATGAATTCCGAATCTTGAGTGGGATG(SEQ ID NO18)ATAGAATTCCTCGGGACACCTGTAGCC(SEQ ID NO19)(在下述SEQ ID NO7中,引物RGen780S对应于核苷酸1到18,而引物RGen4550AS对应于核苷酸2197到2214)。
在各种最适扩增条件下,在PCR中使用这对引物。各种pH和Mg++浓度的总共15种不同PCR缓冲液被使用在两个不同的退火温度,而每个反应的产物样品在1%琼脂糖凝胶上分离。因为通过肉眼观察任何反应条件的溴化乙锭染色凝胶没能检测到任何扩增产物,利用更敏感的Southern杂交检测PCR产物。
通过电泳分离扩增的DNA等份试样,使用常规Southern印迹吸印技术使其转移到Hybond N+尼龙膜,并与[32P]标记的完整大鼠cDNA杂交。杂交条件基本上如前述章节A中描述的文库筛选方法。放射自显影表明在两个反应物中已产生约2.2kb的少量DNA,而从两个反应物中扩增产物的其余部分在琼脂糖凝胶上被分离。从所述凝胶洗脱2.2kb区(即使没有肉眼可见的带)并将其用做另一个PCR反应的模板,其中使用相同引物(SEQ ID Nos18和19),Tris-HCl缓冲液(pH8.0,含1mM Mg++),退火温度为55℃。第二次PCR的扩增产物在凝胶中是可见的并被洗脱和克隆到pBS+质粒中(Stratagene,La Jolla,CA)供序列分析用。
产生的RT-PCR克隆经测定含2214bp如在SEQ ID NO7中给出的。所述克隆编码在大鼠脾cDNA克隆中发现的结构域2到6,外加一个氨基端结构域1,外加一个羧基端结构域7,以及似乎为另一个羧基端结构域8的164bp。紧邻结构域1的5’的是一个外加的144bp序列,推测是从前导区与第一结构域之间的内含子衍生而来。此克隆不含5’前导序列或3’跨膜与细胞质区。除了先前在脾cDNA克隆中鉴定的结构域6之外,RT-PCR中的第七和第八结构域支持此克隆是新型啮齿类ICAM的论点。
实施例2
Northern印迹分析为进一步研究根据独特的Ig样结构域所推测的实施例1中鉴定的ICAM相关克隆编码一种新型ICAM多肽的可能性,通过Northern印迹分析检测组织特异性表达以容许与先前报道的人类ICAMs表达模式比较[ICAM-1,Dustin等,J.Immunol.137245-254(1986);ICAM-2,Staunton等,Nature 33961-64(1989);ICAM-R,deFourgerolles和Springer,J.Etxp.Med.175185-190(1992)]。
来自大鼠肺,脑,脊髓,肝,消化道,胸腺,淋巴结,和脾的总细胞RNA用STAT60 RNA分离试剂(Tel-检测“B”,Inc,Friendswood,Texas)按照制造商建议的方法制备。Poly A+RNA用寡dT纤维素柱从总RNA纯化。从每种组织中获得的约5微克RNA在1%甲醛琼脂糖凝胶上分离并转移到hybond C纤维素膜(Amersham)。
对应于结构域2到4(SEQ ID NO6中的核苷酸1到724)的实施例1的大鼠脾cDNA片段被亚克隆到pBluescript SK+(Stratagene)而反义RNA探针通过体外转录用32P标记的UTP和大约500微克的线性化模板按照制造商(Boehringer Mannheim,Indianapolis,IN)建议的方法产生。膜结合RNA在含50%甲酰胺,5 X SSC,1 X PE(50mMTris-HCI,pH7.5,0.1%焦磷酸纳,0.2%聚乙烯吡咯烷,0.2%焦蔗糖,5mM EDTA,1%SDS)和150微克/毫升变性桂鱼精子DNA的溶液中预杂交。通过煮沸变性放射标记探针并加入到预杂交液使终浓度为1×106cpm/ml。杂交在65℃进行16-18小时。然后在65℃在含0.1%SDS的2 X SSC中洗杂交膜并随后X光胶片曝光3-16小时。
Northern印迹分析表明实施例1中鉴定的ICAM相关cDNA仅在大鼠脑中表达,组织特异性先前没有在任何其他CIAM多肽中有报道。这种表达模式,与未知在其他ICAM多肽中存在的独特的Ig样结构域相结合表明了所述ICAM相关克隆是ICAM家族蛋白质的一个新成员,并被命名为ICAM-4。
最初鉴定的cDNA克隆在大鼠脾文库中被检测到的事实提示脾中的细胞亚单位可能表达低水平的ICAM-4。然而,在许多红细胞生成cDNA库中不能检测到适当的剪接克隆,这导致怀疑是否ICAM-4蛋白质实际上在组织中而不是在脑中表达。一种对在脾中ICAM-4cDNA检测的解释是PCR敏感性可能已扩增了痕量转录物,即使这些组织不表达所述编码的蛋白质。
实施例3全长大鼠ICAM-4 cDNA的分离A.大鼠脑cDNA克隆的鉴定由于ICAM-4的组织特异性表达,脑组织的mRNA被用于试图分离编码ICAM-4的全长cDNA。两个探针,一个与实施例1鉴定的脾cDNA克隆的结构域1到2互补而第二个与结构域3到5互补(SEQ ID NO7),被放射标记并用于筛选λgt10中的大鼠脑cDNA文库,该文库事先自行构建。杂交条件如实施例1中所描述的,而阳性噬斑经过一轮以上的筛选以获得克隆噬菌体。
九个阳性克隆被鉴定出,其中的两个与两个探针均杂交。两个克隆中最长的命名为克隆7,含2550bp,其编码所述探针cDNA中发现的五个Ig样结构域中的四个。此外,克隆7编码在所述探针中没有发现的四个其他Ig样结构域。推测的跨膜和细胞质结构域被鉴定,它们后接一个终止密码,一个多腺苷酸化信号,和一个多聚A尾。如通过与RT-PCT克隆(SEQ ID NNO7)比较所确定的,克隆7缺少至少一个5’Ig样结构域,并且还缺少一个前导序列;重新筛选所述库不产生任何含这些序列的更长的克隆。克隆7的核酸序列在SEQ IDNO10中给出。
B.5’末端的确定为分离结构域1和其他5’序列,使用5’RACE试剂盒(Clontech)应用一种被称为“cDNA末端5’快速扩增(RACE)”的PCR技术[PCR方法方法与应用指导,Innis等,(eds)Academic PressNewYork(1990)28-38页]。这个技术应用一种内部引物与互补于cDNA文库分子5’端所连接的接头序列的第二个引物配对。因此,用这种引物对进行的PCR将扩增和有利于鉴定间隔序列。然后可用重叠的序列资料产生所述基因的一个完整序列。
来自大鼠脑的RACE即用式cDNA(试剂盒中提供)在PCR中与所述试剂盒的寡核苷酸以及以内部ICAM-4序列为基础的反义引物一起使用。所述3’反义引物(命名为Spot714AS)根据ICAM-4结构域4序列进行设计并在SEQ ID NO20中给出。
CARGGTGACAAGGGCTCG (SEQ ID NO20)由该引物对产生的扩增产物随后经过第二次PCR,其中使用相同的5’试剂盒引物和互补于ICAM-4结构域1的3’引物。第二个3’引物被命名为RRACE2并在SEQ ID NO21中给出。
TATGAATTCAGTTGAGCCACAGCGAGC (SEQ ID NO21)在第二次PCR中使用的每个引物含EcoRl位点以利于克隆产生的扩增产物到pBS+(Stratagene)。产生的含该基因5’末端的质粒DNA通过与大鼠ICAM-4结构域1和2的探针(对应于SEQ ID NO7中的核苷酸1到736)杂交进行鉴定。结构域1的部分序列资料和疏水的前导序列从产生的扩增产物确定。
5’RACE方法的产物是一个含起始甲硫氨酸上游60bp的222bp长度的DNA片段,一个82bp的前导序列和一个80bp的来自结构域1的序列。所述扩增产物在SEQ ID NO11中给出。
C.大鼠ICAM-4的全长序列全长ICAM-4的组合克隆从5’RACE方法获得的序列资料(SEQ IDNO11),RT-PCR克隆(SEQ ID NO7)和脑cDNA克隆7(SEQ IDNO10)构建。大鼠ICAM-4的全长基因被测定为包含2985bp,有一个编码推导的917个氨基酸蛋白质的单一开放阅读框。一个推测的Kozak序列位于前导序列中的甲硫氨酸残基的上游。一个27氨基酸疏水前导序列后接九个Ig样结构域,一个跨膜区和一个58氨基酸的细胞质尾。所述组合ICAM-4 cDNA在SEQ ID NO1中给出,而推导的氨基酸序列在SEQ ID NO2中给出。
类似于其他ICAM多肽,ICAM-4含细胞外,跨膜和细胞质结构域。在细胞外结构域中,ICAM-4的氨基末端是由氨基酸1到27组成的前导序列后接九个免疫球蛋白(Ig)样结构域,这是ICAM-4独有的特点,因为ICAM-1,ICAM-2和ICAM-R分别含五个,两个和五个细胞外Ig样结构域。在ICAM-4中,结构域1由氨基酸28到118组成;结构域2由氨基酸119到224组成;结构域3由氨基酸225到321组成;结构域4由氨基酸322到405组成;结构域5由氨基酸406到488组成;结构域6由氨基酸489到569组成;结构域7由氨基酸570到662组成;结构域8由氨基酸663到742组成;结构域9由氨基酸743到830组成。在每个结构域中,独有的“环”结构由一般位于结构域氨基酸序列对应末端的半胱氨酸残基之间的二硫键形成。ICAM-4的其他结构特征包括由氨基酸831到859组成的跨膜区和由氨基酸860到917组成的细胞质区。
大鼠ICAM-4中每个结构域与ICAM家族的其他成员之间氨基酸序列同源性的比较被局限于人类ICAM-1,ICAM-2和ICAM-R相应序列,因为此前尚无有关全部三种啮齿类同源物的序列资料。在第一个结构域中,啮齿类ICAM-4显示与人的ICAM-1,ICAM-2和ICAM-R一致性分别是百分之21,30和28。第二个结构域更为保守,与ICAM-1,-2和-3的氨基酸一致性百分率分别是60,42和62。结构域3-5显示与ICAM-1分别有百分之48,49,和40的一致性,而对ICAM-R而言则分别是百分之60,59和29的一致性。令人感兴趣的是,大鼠ICAM-4结构域6到8与结构域5分别有更多的同源性(范围从29-42%的一致性),很可能产生于基因的分段复制反应。第九个和最后的细胞外结构域与其他ICAM结构域序列可对比性差,但与人类VCAM-1(参与细胞粘附的蛋白质Ig家族的另一个成员)的第三和第六结构域有22%的一致性。细胞质尾有58氨基酸长。这比ICAM家族的其他成员长,其中人类ICAM-1,-2和-3分别含28,26和27个氨基酸。由于有第九个结构域,大鼠ICAM-4与仅含19个氨基酸的人类VCAM-1的细胞质尾有最大同源性。大鼠ICAM-4的膜近侧19个氨基酸与VCAM-1有共同的7个氨基酸残基(37%)。
最后,与LFA-1(CD11a/CD18)的功能性结合定位在ICAMs的第一个结构域。Vonderheide等[J.Cell.Biol.125215-222(1994)]鉴定了据称涉及整联蛋白结合的一个序列基元。尽管大鼠ICAM-4与其他ICAMs在结构域1的同源性相对低,而这种结合序列基元是保守的,从而提示大鼠ICAM-4可能是LFA-1的配体并可能是其他整联蛋白。
实施例4脑组织中的原位杂交为了定位表达ICAM-4的具体脑组织,用ICAM-4结构域1和ICAM-4结构域3到4的反义RNA探针进行原位杂交。所述探针通过体外转录用35S标记的UTP进行标记。
正常大鼠脑的冷冻组织切片被固定在4%低聚甲醛中20分钟,冲洗并脱水,杂交前所述被固定的RNA在2 X SSC,70%甲酰胺中70℃变性2分钟,组织切片在含50%甲酰胺,0.3M NaCl,20mM Tris-HCl,pH7.4,5mM EDTA,10%葡聚糖硫酸酯,1 X Denhardt,0.5mg/ml酵母RNA,100mM DTT和50,000cpm/微升浓度的探针溶液中50℃杂交过夜。在4 X SSC,10mM DTT室温中洗涤切片一次共60分钟,在50%甲酰胺,2X SSC,10mM DTT,60℃洗涤一次共40分钟,并在2X SSC和1X SSC中,室温30分钟各一次。在用相同方法但还包括在50%甲酰胺,1X SSC,10mM DTT中60℃,40分钟更严紧的洗涤下进行的平行实验中测定杂交特异性。洗涤后,所述切片被浸没在NTB2乳胶(Kodak,Rochester,NY)中曝光2到21天,然后显影并复染。阴性对照除了人类免疫缺陷病毒(HIV-1)RNA探针外,包括从ICAM-4结构域1产生的反义探针和ICAM-4结构域3到4的有意义RNA探针。
在脑组织中检测到的信号主要定位在灰质中,且在大脑皮层和海马中的信号最强。杂交结果与ICAM-4主要在脑神经元中表达一致。
实施例5ICAM-4融合蛋白的产生大鼠ICAM-4/谷胱甘肽S转移酶(GST)融合蛋白是用原核表达载体pGEX(Pharmacia,Alameda,CA)产生的以产生针对具体ICAM-4多肽片段的单克隆抗体。
对应于结构域1的5’和3’末端以及结构域2的5’与3’末端的PCR引物被用于扩增编码各个结构域的DNA片段。产生的片段被分别克隆到pGEX-2T的EcoRI位点;DNA序列分析证实了正确的取向和阅读框。随后筛选转化子产生适当分子量融合蛋白的能力。
ICAM-4结构域1/GST与ICAM-4结构域2/GST融合蛋白通过在含1%SDS的PBS中进行超声处理裂解细菌后留在不溶性组分中。从100毫升培养物得到的不溶性蛋白质组分在装载了染料的SDS中煮沸并在10%制备型聚丙烯酰胺-SDS凝胶上分离。所述凝胶在冰冷却的0.4M KCl中染色并切下融合蛋白带。融合蛋白从所述凝胶切片在含25mM Tris-HCl和192mM甘氨酸的缓冲液的透析袋中电洗脱。通过OD280测定大约的蛋白质浓度并用考马斯兰染色在SDS-PAGE上测定制剂纯度。
实施例6大鼠ICAM-4/GST融合蛋白的单克隆抗体的产生通过用弗氏完全佐剂(FCA)乳化的40-50微克ICAM-4结构域-2/GST融合蛋白(实施例5中描述的)皮下注射免疫Balb/c小鼠。两周后,所述小鼠再次用同样蛋白质(但以弗氏不完全佐剂乳化)通过皮下注射免疫。第二次注射两周后给予的两次最后的腹膜内免疫包含无佐剂的可溶性抗原,间隔为两周。通过ELISA检测每只免疫小鼠血清与下面描述的杆状病毒表达系统产生的大鼠ICAM-4发生特异性反应的能力。
无菌操作移出1654号小鼠的脾并放在10毫升无血清RPMI1640中。通过研磨两个玻璃显微镜栽片冷冻末端之间的所述脾组织制取单细胞悬液,所述栽片是浸没在补充了2mM L谷氨酰胺,1mM丙酮酸钠,100单位/毫升青霉素和100微克/毫升链霉素的无血清RPMI1640(Gibco,Burlington,Ottawa,Canada)中的。所述细胞悬液通过一只无菌的70目Nitex细胞渗滤器(Becton Dckinson,Parsippany,NJ)进行过滤,并用RPMI洗两次然后200xg离心5分钟。从最后洗涤产生的沉淀物被悬浮在20毫升无血清RPMI中。取自三只Balb/c幼鼠的胸腺细胞以同样方式制备。
在融合前,NS-1骨髓瘤细胞在含有11%Fetalclone血清(FBS)的RPMI(Hyclone Laboratories,Logan,Utah)中于对数生长期维持3天。一旦收获,即在200xg离心细胞5分钟,并如前述段落中的描述洗沉淀物两次。洗涤后,细胞悬液被转移到终体积10毫升的无血清RPMI中。以20微升一份移出并用无血清RPMI 1∶50稀释,移出每份20微升的稀释液,与20微升在0.85%生理盐水中的0.4%锥虫兰(Gibco)混合,上载到细胞计数器(Baxter Healthcare,Deerfield,IL)并进行细胞记数。大约2.425×108脾细胞与4.85×107NS-1细胞结合,混合物离心并移除上清液。通过轻拍试管移动产生的沉淀并随搅拌加入2毫升在75mM Heps,pH8.0中的50%PEG1500(Boehringer Mannheim,Indianapolis,IN)持续1分钟。随后,另加入14毫升的无血清RPMI持续7分钟。所述细胞悬液200xg离心10分钟并丢弃上清液。得到的沉淀被悬浮在含15%FBS,100μM次黄嘌呤钠,0.4μM氨基喋呤,16μM胸腺嘧啶脱氧核苷(HAT)(Gibco),25单位/毫升白细胞介素6(Boehringer Mannheim)和1.5×106胸腺细胞/毫升的200毫升RPMI中。所述悬浮液首先被放置在225平方厘米的烧瓶中(Corning,Essex,United Kingdom),37℃,4小时,然后以200微升/孔分放到10个96孔平底组织培养板(Corning)中。在融合后3,4,5和6天,通过用20G针头(BectonDickinson)从每孔吸出约100微升并加入100微升除含10单位/毫升白细胞介素6和无胸腺细胞外均如上述的平板培养基,饲养平板中的细胞。
通过抗原捕获ELISA如下进行融合平板的初步筛选。盖好在50mM碳酸盐缓冲液中有100ng/孔的结构域1-GST或结构域2/GST融合蛋白的Immulon4平板(Dynatech,Cambridge,MA)4℃过夜。所述平板被100微升/孔0.5%鱼皮胶(Sigma,St.Louis,MO)的PBS溶液37℃封闭30分钟。封闭之后,用含0.05%吐温20的PBS(PBST)洗3次所述平板,并加入50微升/孔的每种融合物的杂交瘤上清液。在37℃培养30分钟后,如上述洗平板,并加入50微升1∶3500稀释的辣根过氧化物酶偶联的羊抗小鼠IgG(Fc)(JacksonImmunoResearch,West Grove,Pennsylvania)。所述平板被再次培养30分钟并用PBST洗4次。加入底物,100微升/孔,含1毫克/毫升邻苯二胺(Sigma)和0.1微升/毫升30%过氧化氢的100mM柠檬酸溶液(pH4.5)。使颜色反应进行10分钟并用加入50微升/孔15%硫酸终止颜色反应。然后在自动平板读数器上测定490nm光吸收(Dynatech)。
然后通过ELISA对杆状病毒上清液(后述)筛选结构域2-GST蛋白质为阳性而结构域1-GST蛋白质为非阳性的孔。ELISA检测如上描述进行不同的是Immulon4平板最初用在50mM碳酸盐缓冲液中1∶4稀释的杆状病毒上清液覆盖过夜。通过在RPMI,15%FBS,100μM次黄嘌呤钠,16μM胸腺嘧啶,和10单位/毫升白细胞介素6中的倍比,逐次稀释克隆三个孔(103A,103B和103F)两到三次。4天后,肉眼记数克隆平板的孔并记录最稀的孔中的集落数。7到10天后,通过ELISA再次检测选出的每个克隆的孔的结构域1-GST蛋白和结构域2-GST蛋白或杆状病毒上清液。
通过杂交瘤产生的单克隆抗体用ELISA鉴定同种型。用1∶500050mM pH9.6碳酸盐缓冲液稀释的50微升/孔羊抗小鼠IgA,IgG,或IgM(Organon Teknika,Durham,NC)在4℃覆盖Immulon4平板(Dynatech)。在37℃用1%BSA的PBS溶液封闭孔30分钟,用PBST洗3次。加入1∶10稀释的杂交瘤培养上清液(50微升)到每个平板,培养并如上述洗涤。最后洗涤物移出后,加入50微升辣根过氧化物酶偶联的兔抗小鼠IgG1,G2a,G2b或G3(Zymed,San Francisco,CA)(用1%正常山羊血清1∶1000稀释于PBST中)。如上培养平板,用PBST洗4次,加入100微升底物。5分钟后,加入50微升15%硫酸结束颜色反应,并在平板计数器(Dynatech)上测定490nm光吸收。
结果表明抗体103A,103B和103F均是IgG1同种型。这些抗体随后被用于免疫化学分析,Western印迹,和用于纯化在杆状病毒中表达的蛋白质。
实施例7大鼠ICAM-4的杆状病毒表达杆状病毒表达系统(Invitrogen)被用于产生对应于ICAM-4结构域1到6的可溶性蛋白质。因为ICAM-4的前导序列当时尚属未知,构建表达结构包含将3’融合到适当阅读框中ICAM-1前导序列的ICAM-4编码序列。有关ICAM-1/ICAM-4表达质粒之结构的具体详细内容如下所述。
使用结合了数个便利构建融合质粒特征的引物通过PCR扩增编码五个Ig样结构域的大鼠ICAM-1 DNA。除了前导序列中第一个甲硫氨酸上游的共有Kozak序列外,所述5’寡核苷酸引物包含HindIII和BglII位点。所述3’寡核苷酸引物包含六个组氨酸编码序列后接一个终止密码和一个HindIII克隆位点。PCR扩增产物被克隆到HindIII消化的pBS+载体中,而序列分析证实了恰当的结构。ICAM-1前导序列中的内部SmaI位点和载体多克隆区(3’到ICAM-1 Ig样结构域5)中的另一个SmaI位点被消化,这样除去了大部分ICAM-1编码序列。这些操作后,线性化的,平末端的载体包含了一部分上游多克隆区(那些限制位点在多克隆区中的原始HindIII位点的5’),Kozak序列和大部分ICAM-1前导序列。
大鼠ICAM-4结构域1到6的编码序列通过PCR用设计使这个序列克隆到上述线性化载体中的引物进行扩增。其5’寡核苷酸引物包含一个EcoRV位点和需要完成ICAM-1前导序列的密码子。其3’寡核苷酸引物包含六个组氨酸残基的密码子,一个终止密码子和HindIII以及EcoRV限制位点。该PCR的扩增产物用EcoRV消化以产生平末端序列,然后再连接到平末端化的SmaI消化的pBS+线性化载体中。含ICAM-4结构域1到6之5’的ICAM-1前导区的完整序列用BglII和HindIII消化从所述结构中移出,并将纯化的ICAM-1/ICAM-4融合序列直接克隆到BglII/HindIII消化的pBluesac III载体中(Invitrogen)。
最初使用实施例5中描述的大鼠ICAM-4结构域-2/GST融合蛋白免疫小鼠得到的免疫血清通过ELISA检测重组病毒的蛋白质生产。在后来的研究中,使用来自这些小鼠的单克隆抗体纯化由SF9细胞中的重组杆状病毒产生的ICAM-4蛋白质。
实施例8生产抗杆状病毒表达的大鼠ICAM-4的单克隆抗体大鼠ICAM-4结构域1-6在实施例7中描述的杆状病毒表达系统中表达。用单克隆抗体103A(如实施例6中描述的)纯化所述重组蛋白质。
简言之,30毫克的纯化单克隆103A(在100mM硼酸钠,500mM氯化钠中)与三克Activated Cyanogen Bromide Sepharose4B(Pharmacia,Piscataway,NJ)偶联。含重组大鼠ICAM-4(结构域1-6)的杆状病毒上清液被上载到Sepharose柱4℃过夜。在无钙-镁磷酸盐缓冲生理盐水(CMF-PBS)中洗所述柱,而被结合的物质在50mM柠檬酸,500mM氯化钠pH4.0中洗脱。用1/10体积的Tris pH10中和所述样品并存放在-20℃。在SDS-PAGE上分离的纯化蛋白质似乎纯度高于90%并以约80kD迁移。
用与实施例6中描述的类似方式纯化的重组大鼠ICAM-4结构域1-6蛋白质免疫小鼠。1945号小鼠的脾被用于127号融合物。融合方法如实施例6中的描述。通过ELISA在重组ICAM-4蛋白质上筛选融合物的孔。第二次筛选包括在大鼠脑切片上进行免疫细胞化学检测(如下面实施例9中的描述)。从该融合物中克隆出四个另外的大鼠ICAM-4特异性抗体127A,127E,127F和127H。在大鼠脑切片上每个抗体的免疫细胞化学染色模式与用单克隆抗体103A(参见实施例9)所观察的相同。检测所述单克隆抗体结合D1/GST和D2/GST融合蛋白的能力(在实施例5中描述的)。单克隆抗体127A识别D1/GST融合蛋白而127H识别D2/GST融合蛋白。这两个独特的结合特异性以及其他单克隆抗体不与两种GST蛋白的任何一个结合的特点提示至少3种不同的表位被该组抗体识别。杂交瘤127A和127H分别在1995年5月31日和1995年6月1日保藏在美国典型培养物保藏中心(12301 Parklawn Drive,Rockville,Maryland 20852)并分别指定保藏号为HB11905和HB11911。
实施例9
大鼠ICAM-4表达的免疫细胞化学检测用单克隆抗体103A进行免疫细胞化学检测定位大鼠脑内蛋白质的产生部位。
从正常成年雌性Lewis大鼠收获脑,矢状切片,并在无RNase的1 X PBS中冰上洗涤30分钟。然后将脑切片放在含少量O.C.T.化合物(Miles,Inc.,Elkhart,IN)的Tissue Tek II冷冻模具中(MilesLaborotoryies,Inc.,Naperville,IL)。在所述模具中,所述脑被定位在中央,用OCT化合物充填所述模具,然后放在含2-甲基丁烷(Aldrich Chemical Company,Inc.,Milwaukee,WI)的容器中,并将所述容器放在液氮中。一旦冷冻模具中的组织和OCT化合物冻结时,冻块被存放在-80℃直到用于切片。
所述组织被切成6微米厚度的切片,贴到Vectabond(VectorLaboraotries,Inc.,Burlingame,CA)覆盖的载片上并使其在室温空气干燥过夜直到使用。所述切片被固定在乙醚(Malinckrodt,Paris,KY)中在室温持续5分钟。一旦所述栽片从乙醚中取出,使乙醚挥发。每个组织切片用150微升50%正常大鼠血清(Sigma)和2%牛血清白蛋白(BSA)(Sigma)在1 X PBS中(仅使用磷酸钠)室温封闭30分钟。封闭后,所述溶液被轻轻从切片吸出,而纯化的上清抗体103A(1.65mg/ml)以1∶10在封闭的溶液中稀释,并施加150微升到每个组织切片。将载片放在湿盒中并在4℃温孵过夜。
次日,轻轻从切片吸出所述抗体溶液并在1 X PBS中洗载片三次,每次4分钟。从所述载片吸除过多的PBS并向所述组织第二次施加以1∶100稀释于10%正常大鼠血清和2%PBA的1 X PBS溶液中的大鼠抗小鼠生物素偶联抗体(Jackson Immuno-ResearchLaboratories)。室温温孵1小时。在1 X PBS中洗切片两次,每次4分钟,然后向每个切片施加按照产品说明书的方法制备的100微升Elite Rat IgG Vectastain ABC试剂盒的ABC试剂(VectorLaboratories,Inc.,Burlingame,CA)。在室温温孵30分钟。温孵后,在1 X PBS中洗两次(每次4分钟)并向每个切片施加150微升的Vector VIP Proxidase Substrate溶液(VectorLaboratories,Inc.,Burlingame,CA)持续约10分钟。显色后,在流水下冲洗切片5分钟,用Mayer苏木精(Sigma)复染20秒,并再次轻轻流水冲洗5分钟。所述载片用梯度系列的乙醇脱水,二甲苯过渡,并用Accumount60(Stephens Scientific,Riverdale,NJ)固定。
用单克隆抗体103A染色的大鼠脑切片的免疫组织化学表明大鼠ICAM-4在海马的神经元细胞中表达。染色模式提示所述蛋白质可能被局限于神经突触(树突)。用无关抗体或单独第二步骤的试剂以同样方式染色的脑切片不显示用单克隆抗体103A所见的独特表达模式。
实施例10人类ICAM-4基因组DNA的克隆在从基因组DNA克隆大鼠ICAM-4期间,发现ICAM-4与ICAM-1相互位置在5kb之内并且该信息被利用在试图克隆ICAM-4的人类同源物。
Genome Systems Inc.(St.Louis,MO)使用人类ICAM-1结构域3引物,所设计的与人类ICAM-1结构域3(H-1/D3S)互补的有意义引物和与人类ICAM-1结构域3(H-1/D3 AS)互补的反义引物通过PCR扩增了人类P1文库中的片段。这些引物分别在SEQ ID Nos22和23中给出。
CCGGGTCCTAGAGGTGGACACGCA(SEQ ID NO22)TGCAGTGTCTCCTGGCTCTGGTTC(SEQ ID NO23)两个克隆(命名为1566和1567)被鉴定并被进一步分析。两个P1克隆均含约75-95kb的基因组DNA插入片段。用BamHI消化克隆,用琼脂糖凝胶电泳分离,并转印到尼龙膜上。在低严紧条件(30%甲酰胺)或高严紧条件(60%甲酰胺)在42℃与人类ICAM-1,ICAM-3或大鼠ICAM-4放射标记探针进行Southern印迹杂交;杂交溶液的其他成分如实施例1中描述的。低严紧杂交系列在含0.1%SDS的2 XSSPE中室温洗涤。高严紧杂交在含0.1%SDS的0.2 X SSPE中65℃洗涤。被洗的膜在X光胶片中曝光3.5小时。
不同的杂交表明人类ICAM-1包含在5.5kb的BamHI片段中,而人类ICAM-3定位在一个4.0kb和一个1.5kb的BamHI片段中。所述人类ICAM-1和ICAM-R片段被亚克隆到pBS+中,它们的特性通过有限序列分析所证实。
在高严紧条件下与大鼠ICAM-4杂交的7.0kbBamHI片段被亚克隆并用RsaI限制消化形成进一步的片段。鉴定出与大鼠ICAM-4杂交的三个RsaI片段并测定了它们的序列。根据与大鼠ICAM-4的同源性,这些片段似乎包含结构域2,3,4,5和部分结构域6。
实施例11人类ICAM-4cDNA的克隆对应于人类ICAM-4(实施例10中描述的)结构域2-5的基因组DNA片段被作为探针使用以筛选λgt10人类海马cDNA文库(Clontech,Palo Alto,CA)。所述文库的筛选方法基本上如实施例1中所描述的。
在所述文库中发现的最长的人ICAM-4克隆(18号)仅有992bp(SEQ ID NO24),并基本上对应于预期的3kb基因的中间部分。来自克隆18(SEQ ID NO24)的992bp DNA插入片段被用做筛选λZAPII人类海马cDNA库(Stratagene,La Jolla,CA)的探针。这个库产生许多阳性克隆。最长的克隆(34号)是2775bp(SEQ ID NO25)。根据与全长大鼠ICAM-4的序列对比,推测这个克隆丢失了前导序列和约30bp的结构域1的5’末端。在3’末端的poly A尾丢失了,但转录终止密码仍存在。
对应于前三个结构域(34号克隆中的核苷酸1到840)的DNA片段被用做探针筛选从人类大脑皮层获得的λgt 10 cDNA文库(Clontech,Palo Alto,CA)。一个克隆,16-1(SEQ ID NO26)被鉴定为含1557bp,并包括了39bp的5’非翻译DNA,一个前导序列和整个第五结构域的序列信息。重叠的克隆34号(SEQ ID NO25)与16-1(SEQ ID NO26)用于产生一个组合的全长人类ICAM-4序列(SEQ ID NO27)。
所述全长基因是2927bp长并编码一个924氨基酸的蛋白质。该ICAM-4核苷酸序列在SEQ ID NO27中给出,而氨基酸序列在SEQID NO28中给出。与全长大鼠ICAM-4基因(SEQ ID NO11)序列对比显示全部DNA序列的一致性是82%,而氨基酸水平上一致性是85%。所述蛋白质的明显的9个Ig样细胞外结构域在大鼠和人之间是保守的。前导序列从氨基酸1延伸到28;结构域1从氨基酸29到117;结构域2从氨基酸118到224;结构域3从氨基酸225到320;结构域4从氨基酸321到405;结构域5从氨基酸406到488;结构域6从氨基酸489到570;结构域7从氨基酸571到663;结构域8从氨基酸664到743;结构域9从氨基酸744到837;跨膜区从氨基酸838到857,而细胞质尾从氨基酸858到924。
除了与ICAM-1和ICAM-R的一般联系外,人类ICAM-4(HuICAM-4)还显示某些共同的结构特征,这些特征使它们组合在一起如同一个分子家族。一个结构域通过HuICAM-4与其他ICAM成员的功能区序列对比显示同源性的变化程度。HuICAM-4的结构域1氨基酸序列与ICAMs-1,2和3的结构域1的一致性分别是21,30和26%。HuICAM-4的结构域2与ICAMs1,2和3的结构域2的一致性分别是61,39和62%。HuICAM-4的结构域3与ICAMs-1和3的结构域3的一致性分别是50和65%。HuICAM-4的结构域4与ICAMs 1和3的结构域4的一致性分别是54和64%。HuICAM-4的结构域5-8与ICAMs-1和3的第5结构域是最同源的,与ICAM-1结构域5的一致性百分率范围从33-47而与ICAM-R结构域5的是21-31。HuICAM-4的九个结构域与ICAM家族其他成员的序列可对比性低,但与HuICAM-1的结构域3(24%一致性)和6(23%一致性)是同源的。
实施例12人类ICAM-4表达的Northern分析两个人类多组织Northern(MTN)印迹从Clontech(Palo Alto,CA)购得。它们包含至少2微克的poly A+RNA来自16个不同人类组织(表1中给出)在1.2%琼脂糖凝胶上电泳并转移到尼龙膜上。所述印迹在42℃10毫升的含5 X SSPE,10 X Denhardts液,50%甲酰胺,2%SDS和100微克/毫升变性桂鱼精子DNA的溶液中预杂交。所述印迹在上述溶液中与放射标记的人类ICAM-4探针(18号克隆,SEQ ID NO24)42℃杂交16小时。次日,所述印迹在0.1 x SSC/0.1%SDS溶液中,室温洗涤,随后在50℃洗涤。所述印迹在-80℃,经24小时被曝光到X光胶片。分析结果在表1中给出。
只有含脑RNA的与ICAM-4探针杂交的泳道给出一条约3kb的带。更长时间的曝光(5天)证实只有脑包含可检测水平的信息。为测定是否全部泳道含类似质量的可比较量的RNA,将同一印迹与对照β肌动蛋白探针杂交。通过用煮沸的0.1%SDS溶液处理15分钟脱去ICAM-4探针的印迹,随后用制造商提供的β肌动蛋白探针以类似的方式探测。除了在量上的较少改变外,全部泳道显示出良好的RNA质量。
表1人类ICAM-4表达的Northern组织分析探针组织 ICAM-4 β肌动蛋白心 - +++脑 + ++胎盘 - +++肺 - +++肝 - +++骨骼肌 - ++++肾 - +++胰 - ++脾 - +++胸腺 - +++前列腺 - +++睾丸 - +++卵巢 - +++小肠 - +++大肠 - +++外周血白细胞 - +++
两个另外的Northern印迹从Clontech购得,它们包含人脑16个不同的亚区域的poly A+RNA(如表2中所示)。以类似于组织分析使用的方式对印迹进行探测,结果在表2中给出。上载的RNA质量和数量通过用β肌动蛋白探针探测所述印迹进行检查。
呈现ICAM-4表达的全部区域是端脑的一部分,例外的是被认为属于部分间脑的丘脑。海马和大脑皮层似乎表达水平最高。各个情况中的转录物大小是相同的(3kb)。ICAM-4表达的精细组织分布提示启动子区可能包含为所观察到的基因产物的发育和空间表达起促进作用的元件。利用这个资料可为深入理解一般意义的神经基因的表达控制提供帮助。
表2人类ICAM-4表达的Northern脑细胞类型分析探针脑区域 ICAM-4 β肌动蛋白扁桃体++ +++尾状核++ +++胼胝体+ +++海马 ++ +++下丘脑- +++海恩茨氏体- +++丘脑底核 + +++丘脑 + +++小脑 - +++大脑皮层 +++ +++髓质 - +++脊髓 - +++枕叶 ++ +++额叶 ++ +++颞叶 ++ +++豆状核++ +++
实施例13人类ICAM-4/IgG融合蛋白的产生构建人类ICAM-4/IgG1融合蛋白表达质粒以产生用于生成单克隆抗体和用于鉴定潜在ICAM-4配体的粘附测试的蛋白质。制作了两种结构;第一种包含编码HuICAM-4结构域1-3的DNA,而第二种包含编码结构域4-8的DNA。两者被连接到载体pDCS1中的人类IgG1的Fc区,所述载体使用巨细胞病毒(CMV)启动子驱动表达并使用IgG4的信号序列促进分子的分泌。
PCR引物(如下面SEQ ID NO29-32所示)被设计以产生亚克隆所必须的DNA片段。结构域1(HI4-D1(s),SEQ ID NO29)的5’末端的“有义”引物被设计充填34号克隆中丢失的结构域1的30个碱基对。引物HI4-D1(S)(SEQ ID NO29)和HI4-D3(AS)(SEQ ID NO30)被用于产生编码人类ICAM-4结构域1-3的DNA片段,它对应于SEQ ID NO1中的第130核苷酸到第996核苷酸之间的区域。引物HI4-D3(S)(SEQ ID NO31)和HI4-D8(AS)(SEQID NO32)被用于产生编码人类ICAM-4结构域4-8的DNA片段,它对应于SEQ ID NO30中的核苷酸997到核苷酸2268之间的区域。每个5’引物编码一个BamHI限制位点(GGATCC,在下面用粗体表示)而每个3’(反义)引物包含一个XhoI位点(CTCGAG,在下面用粗体表示)以便利IgG1基因的5’亚克隆。所有寡核苷酸在容许的限制性消化的5’端均包含间隔区核苷酸(下面下划线部分)。
HI4-D1(S) (SEQ ID NO29)GTACTTACAGGATCCGCGGTCTCGCAGGAGCCCTTCTGGGCGGACCTACAGCCTGCGTGGCGTTCHI4-D3(AS)(SEQ ID NO30)ATTTCTCTCGAGGATGGTCACGTTCTCCCGGHI4-D4(S) (SEQ ID NO31)ATTTCTGGATCCTACGCTTCCCGGCACCACTC
HI4-D8(AS)(SEQ ID NO32)ATTTCTCTCGAGTTCCACGCCCACAGTGACGG使用带有AmpliTaq酶的由Perkin Elmer提供的缓冲液在50微升体积中进行PCR反应。加入的引物最终浓度是10微克/毫升并包含2mM的全部四种dNTP。反应持续30个循环的变性(94℃ 4分钟),退火(50℃ 2分钟)和延伸(72℃ 1分钟)。在琼脂糖凝胶上观察PCR反应产物,每个反应产物取一份用于亚克隆所述PCR产物到载体pCRII(Invitrogen,SanDiego,CA)中。进行序列分析检测扩增过程中可能发生的错误并确认适当的取向。用BamHI和XhoI消化合适的克隆并用琼脂糖凝胶电泳分离片段。纯化的片段被连接到预先用BamHI和XhoI消化的载体pDCS1中,而产生的质粒被测序以证实适当的取向和阅读框。
在所述表达质粒瞬时转染到COS7细胞并从培养基分离出分泌的蛋白质之后得到人类ICAM-4结构域1-3和4-8/IgG1融合蛋白质。转染进行如下。粘附COS7细胞在约50-60%铺满的时候用CMF-PBS洗并随后与10-15微克的质粒DNA在7.5毫升无血清DMEM培养基(Gibco,Gaithersburg,MD)中接触,所述培养基中含6微升0.25M的氯喹(Sigma,St.Louis,MO)。另外加入7.5毫升含150微升DEAE葡聚糖(50毫克/毫升)(Sigma,St.Louis,MO)无血清培养基并培养所述平板2-3小时,然后移出培养基并用10%DMSO(Mallinckrodt,McGaw Park,Illinois)的PBS溶液取代之。培养1分钟后,移出DMSO溶液并用含5%FBS的新鲜培养基替换。每份转染包括多个平板,并汇合表达同样蛋白质的细胞培养基以分离蛋白质。
每三天收集培养基共经过3-4个收获期。用经过35mMTris,150mM NaCl,pH7.5预平衡的0.4-0.8毫升Procep A柱(Bioprocessing Ltd,England)纯化蛋白质。培养基上柱两次,流速低于每小时60柱体积。用20柱体积的Tris/NaCI缓冲液,20柱体积的0.55M二乙胺(pH8.5)和20柱体积的50mM柠檬酸(pH5.0)各洗一次。用pH3.0的50mM柠檬酸洗脱融合蛋白成一毫升组分,并用1/10体积的1M Tris(pH9.5)中和每个组分。通过OD280测定蛋白质浓度,并用SDS-PAGE测定纯度。
注意到来自牛IgG(存在于FBS中)的明显污染。即使预计结构域1-3融合蛋白比结构域4-8融合蛋白小,两者迁移率均约在90kD。这个观察结果的可能解释是较小的结构域1-3融合蛋白可能比较大的结构域4-8融合蛋白更多的糖基化。
除了使用纯化的蛋白质生产单克隆抗体外(如下所述),所述蛋白质将被用于粘附测试以鉴别ICAM-4配体。
实施例14单克隆抗体的生产如实施例13中描述的纯化蛋白质被用于使用实施例6中描述的免疫方法产生单克隆抗体。
2250号小鼠(用HuICAM-4 D1-3/IgG1免疫)的脾用于融合172,而2272号小鼠(用HuICAM-4 D4-8/IgG1)的脾用于融合173。使用的融合方法如实施例6中的描述。通过ELISA(基本上如实施例6中的描述)使用每个HuICAM-4/IgG1融合蛋白筛选融合平板。那些识别所述免疫原蛋白质的融合孔上清液被认做克隆。人类海马切片的免疫细胞化学被用于第二次筛选。
来自每个融合的一个初级克隆通过免疫细胞化学鉴定为阳性并被克隆。两个克隆之一在进行克隆时没有生长,仅剩下一个侯选克隆待查,即来自HuICAM-4 D4-8/IgG1免疫小鼠的克隆173E。杂交瘤173E于1995年6月1日被保藏在美国典型培养物保藏中心,12301Parklawn Drive,Rockville,Maryland20852,并被指定保藏号为HB11912。
从对应于结构域1-3的可溶性ICAM-4片段免疫的小鼠获得的另一个融合发现六个克隆(179A,179B,179D,179H,179I和179K)对HuICAM-4结构域1到3(D1-3)是特异的。该179系列的全部六种抗体均结合到齿状回的树突,以及多态和锥体细胞层。除树突外,单克隆抗体179A还染色了这些区域的神经元细胞体。产生抗体179I和179H的杂交瘤细胞系于1996年6月10日被保藏在美国典型培养物保藏中心,12301 Parklawn Drive,Rockyille Maryland,20852并分别指定保藏号为HB12123和HB12124。
另外的融合以类似的方式进行产生与具体ICAM-4区域有特异性免疫反应性的其他抗体。
实施例15捕获测试的开发来自融合179的六个单克隆抗体以各种结合方式被检测其捕获和检测溶液中可溶性ICAM-4的能力。如下所述测试被建立,以评估与正常和疾病状态有关的人类体液中的可溶性ICAM-4水平。
使抗体179I以3微克/毫升,125微升/孔覆盖Immulon4(Dynatech)96孔板37℃,2小时。通过吸取移出抗体溶液,在室温下用300微升含5%Teleostean明胶的无钙,无镁PBS封闭溶液(CMF-PBS)封闭孔30分钟。通过吸取移出封闭溶液,每孔加入OmniDiluent(CMF-PBS,1%明胶,和0.05%吐温20)稀释的100微升样品流体,并在37℃温孵该混合物30分钟。所述平板用PBST(CMF-PBS,0.05%吐温20)洗三次。抗体179H以1.5毫克/毫升NHS-LC-Biotin(Pierce)按照制造商建议的方法进行生物素化,1∶2000稀释,并加入到所述孔中(100微升/孔)。产生的混合物在37℃温孵30分钟并用PBST洗平板三次。加入链霉抗生物素蛋白-HRP(Pierce)(100微升,0.25微克/毫升)到每孔并在37℃温孵混合物30分钟。所述平板用PBST洗4次,然后加入100微升1∶100稀释于缓冲底物(13.6g/L三水醋酸钠,pH用1M柠檬酸调到5.5,临显色前加入150微升/L的30%过氧化氢)的四甲基联苯胺(Sigma)(10毫克/毫升DMSO储液)。使所述反应在室温黑暗处进行30分钟,然后加入50微升/孔15%硫酸终止反应。在450nm检测吸收值。
结果表明所述测试能检测浓度低到5-10ng/ml的可溶性HuICAM-4 D1-3重组蛋白质。曲线的线性部分在10-100ng/ml范围。当该蛋白质区域检测为1和10微克/毫升时没有观察到与HuICAM4D4-8的交叉反应。
实施例16中风病人血清中的可溶性ICAM-4的评估为了评估ICAM-4在神经学的疾病与体征中的作用,如上述方法测试28位患急性中风病人血清并如上述测试20名年轻健康志愿者(不匹配年龄)在可溶性ICAM-4血清浓度上的差异。
结果表明来自健康志愿者的血清没有可检测到的ICAM-4水平。然而,28名急性中风患者中的20人有可检测到的可溶性ICAM-4水平。阳性中风患者的信号相当于标准的(可溶性ICAM-4 D1-3重组蛋白质)5-38ng/ml的范围。
实施例17癫痫大鼠模型的海马中ICAM4 mRNA水平在以创建一种激发癫痫发作动物模型为目的的方式处理的大鼠海马中评估大鼠ICAM-4 mRNA水平[Lothman等,Brain Res.36083-91(1985)]。在该模型中,通过一只植入所述脑的所述区域中的电极,用一系列亚痉挛性电击刺激大鼠海马,从而引发严重的病情发作。所述激发过程包括每隔一天的一天中施加刺激12次,共8天。一旦充分激发,一个单一刺激即可引起类似于人类癫痫的病情发作和组织学变化。充分激发的大鼠在两周的期间每天接受两次刺激,并在最后的刺激后24小时杀死大鼠。取出海马并切片以制备RNA。
用胍/酚/氯仿提取法[Chomezynski and Sacchi,Anal.Biochem.162156-159(1987)]从每个样品制备总RNA。RNA在变性甲醛琼脂糖凝胶上分离,转移到尼龙膜,并与放射标记的大鼠ICAM-4和三磷酸甘油醛脱氢酶(GAPDH)特异性DNA探针杂交。GAPDH是一种基础的表达基因,它通常用做检测上载到凝胶的RNA在不同泳道之间量的差异的对照物。所述ICAM-4/GAPDH比率的波动反映为ICAM-4表达水平的变化。用磷光测象仪对ICAM-4和GAPDH杂交带定量并确定ICAM-4/GAPDH的比率。
与受激发的测试组(n=5)相比,ICAM-4/GAPDH比率在未受激发的对照组动物(n=5)中明显较高,这提示ICAM-4作为激发过程的结果而受到负调节。然而,应注意到对照组没有受到任何修饰处理,因此存在ICAM-4的mRNA水平受到与激发相关的手术处理的反应性调节的可能性。
实施例18血清ICAM-4浓度作为神经退化性失调的一个鉴别指标循环中的ICAM-4血清浓度被评估为各种神经退化性失调的一种可能指标。如上述实施例16中的描述检测了来自无名供体的血清和(或)血浆样品并与先前无神经学失调的对照供体抽出的样品进行了比较。
对照供体为建立正常健康个体中循环的ICAM-4的基线平均值,检测了100名提供者的血清样品。结果显示12名个体(12%)有高于10ng/ml的ICAM-4循环水平。这12个样品中,五个样品的ICAM-4浓度平均是10-20ng/ml,三个样品显示20-100ng/ml的平均ICAM-4浓度,两个样品显示100-500ng/ml之间的ICAM-4水平,而两个样品含ICAM-4浓度超过500ng/ml。
从两名在为期八个月期间内不同时间点都有很高水平的供体采集样品,以评估在所述期间内观察结果的稳定性。据观察,在数月期间,观测值是波动的。没有这些提供者的医学资料可以利用,将ICAM-4水平与供体的生理健康之间联系起来是不可能的。当血清和血浆样品是从同样的个体制备来的时候,没有观察到存在的ICAM-4水平的差异。
这个观察结果表明在使用血清或血浆时用于可溶性ICAM-4的检测是通用的。此外,所述结果表明ICAM-4在血液中是稳定的,因而提示某些病理学体征导致的ICAM-4水平的上升可能不是瞬时的。最后,由于ICAM-4在血液环境中的明显稳定性,可溶性ICAM-4检测可利用血库的样品,由此减少了每个检测对新鲜血液的需求。
为了确定是否收集与(或)储存的方法影响观察结果,通过以各种方式处理有最高水平循环ICAM-4的一个个体样品并随后测量ICAM-4的水平,检测ICAM-4血清的稳定性。在37℃温孵24小时和一到三次冻/融均不改变该血清中可检测的ICAM-4水平。
患癫痫病的供体对20名患颞叶癫痫病患者(TLE)的样品中ICAM-4血清浓度进行了测量并与有过重癫痫病发作(38名不同的病人),昏厥(8名病人)或是正常健康供体(20人)的对照组患者的血清进行比较。再次使用实施例15中描述的检测方法,而相对于该检测(即可溶性HuICAM-4 DI-3重组蛋白质(实施例13中描述的))使用的内部标准,其结果被表示为ng/ml。
患TLE的全部20名患者的血清有平均大约140ng/ml的ICAM-4检测水平。在3个对照组的全部血清样品中,包括重癫痫病发作组,ICAM-4浓度平均在10ng/ml以下。这些观察结果提示一个个体的ICAM-4血清水平可以代表一种生物化学指标,该指标能区分病灶性发作(如TLE所经历的)和一般性重癫痫病发作。
患爱滋病的供体对有限数目的爱滋病患者血清中的ICAM-4浓度也进行了检测。所述患者按照CD4记数和存在的任何痴呆病症进行分组。对包括16名早期,无症状,CD4记数高于500的第一组进行了检测。第二组包括七名晚期,CD4记数低于300的患者;没有对该组确定痴呆病症。最后一组包括九名晚期爱滋病患者,每个患者表现出痴呆病症。
结果显示16名早期,无症状患者中的四人(25%)的血清样品有可检测到的可溶性ICAM-4水平;这四个样品中的三个ICAM-4浓度超过500ng/ml。7个晚期患者中的4个(57%)血清样品也是ICAM-4阳性的,这4个样品中的两个浓度超过500ng/ml。显示出痴呆病症的晚期患者的样品没有可检测到的ICAM-4水平。该初步研究结果提示ICAM-4可能是爱滋病痴呆相关的神经退化病变的早期指标。
其他神经退化性疾病的供体癫痫与爱滋病血清的研究结果提示其血液中的ICAM-4水平可反映正常情况下表达ICAM-4的神经元损伤情况。有些其他神经学疾病也可(作为其病因学的一部分)表现ICAM-4特异性表达神经元的损伤,其可导致外周血中的ICAM-4血清浓度变化。
例如,Alzheimer’s病与表达ICAM-4的端脑区中广泛性神经元损伤有关。患这种病的早期发病家族类型患者以及患散发型该病的患者血清中ICAM-4的评估可为该病的各个阶段提供指标,由此容许评估可能的治疗干预措施。
在另一个实施例中,由于其他脑皮层痴呆症(如Pick’s病,弥散性皮层Lewy体病,和额叶退化病)有时被误诊为Alzheimer’s病,但通过血清ICAM-4分析可相互区分开并与Alzheimer’s病区分开。在另一个实施例中,患皮层下痴呆症,包括Parkinson’s病,Huntington’s病和进行性核上病的患者血清ICAM-4浓度可上升,做为此类疾病的共同病理指标的一个结果。
在另一个实施例中,一些初级精神病,如抑郁,精神分裂症和精神病是部分以神经退化为特征的,这种退化可能与血液中ICAM-4可检测到的水平有关。
在另一个实施例中,ICAM-4的上升水平可与感染,脉管炎,代谢与营养失调(例如甲状腺,维生素B12缺乏),血管失调(复合性血管梗塞,腔隙状态症,Binswanger’s病),中毒性脑病(例如接触一氧化碳,重金属或其他工业污染)以及肿瘤产生的非遗传性痴呆有关。
实施例19人类ICAM-4上游调节DNA的克隆与分析ICAM-4基因表达在空间上和时间上受调节,其表达限于脑的大部分前侧区和腹侧区,即端脑。在一次试图鉴定与ICAM-4限制性转录调节有关的基因序列时,检测了人类ICAM-4编码序列5’区核苷酸。
对从一个7.0kb基因组BamHI片段(实施例10中描述的)衍生的2607碱基对BamHI/PstI片段进行测序并发现其含ATG起始密码上游1684个核苷酸。该上游区的完整序列在SEQ ID NO33中给出。就ICAM-4编码区的位置而言,ATG起始密码子(SEQ ID NO33中号码为1685-1687)中的“A”被称为+1核苷酸,而与A+1核苷酸5’紧邻的核苷酸被称为-1。因此整个序列被表示为从核苷酸-1684到核苷酸+3,与序列表中的编号核苷酸1到核苷酸1687对应。
以基因组HuICA-4序列为基础合成寡核苷酸并用于PCR以产生上游调节序列区内的各种长度的DNA分子。表3中给出的各寡核苷酸为了容许酶解所述PCR产物包含约6-10bp的间隔区(斜体显示),一个NheI或HindIII限制位点(以粗体显示),和一个特异性杂交引物序列(下划线部分)。所述寡核苷酸名称包含指出其在上游调节区内的位置编号。在PCR扩增时,寡核苷酸如表4所示进行配对以产生含上游调节区的特定区域的DNA片段。
在每个寡核苷酸内产生的限制位点和间隔区容许酶促消化并随后直接克隆各PCR产物到pGL3基本载体中(Promega,Madison,WI),所述载体包含一个紧邻多克隆位点(MCS)下游的荧光素酶报道基因。克隆到所述载体的MCS区中的启动子活性驱动转染细胞中的荧光素酶报道基因的表达,并且可测量从表达的荧光素酶产生的荧光作为启动子活性的指示。所述pGL3基本载体没有启动子,因而起阴性对照作用,而pGL3载体含一个SV40启动子用作为阳性对照。每个表达结构的序列通过限制酶分析和DNA测序进行证实。
表3用于扩增HuICAM-4上游区的PCR引物HI4-19(AS) CAGAACTAAGCTTACAGGAGGCGAGGAGAGCGCGAG(SEQ ID NO34)HI4-114 CAACAATGCTAGCCAAGCGCAACTCTGTCTC(SEQ ID NO35)HI4-149 CAACAATGCTAGCCTTGGAAACCAAGTTACC(SEQ ID NO36)HI4-206 CAACAATGCTAGCAGGAGCTTAGCGCACGCTCG(SEQ ID NO37)HI4-270 CAACAATGCTAGCCATGCCGGCCTCCACGTAG(SEQ ID NO38)HI4-408 CAACAATGCTAGCGTCCAGCTTATTATCATG(SEQ ID NO39)HI4-480 CAACAATGCTAGCCTTAGTCCCCAAATGTATC(SEQ ID NO40)HI4-560CAACAATGCTAGCGGAGAAGGATCAGTGAG(SEQ ID NO41)HI4-817 CAACAATGCTAGCCTCCACCCACCGAGCAGAAG(SEQ ID NO42)
用Transfection MBS Mammalian Transfection试剂盒(Stratagene,La Jolla,CA)按照制造商建议的方法转染含表4中描述的每个扩增序列的质粒进入哺乳动物细胞。每种质粒被引入两个不同的细胞系,COS7和NT2前体细胞(Ntera2/D1,来自Stratagene)。COS7细胞是一种常用的SV40转化的猴成纤维细胞样细胞系,从而使这些细胞完全适合于在所述SV40启动子控制下在阳性对照pGL3 Promoter Vector转化的细胞中驱动一个基因的表达。NT2前体细胞是一种指定用于神经元前体细胞系,虽然它们不表达ICAM-4,它们可能是确实表达ICAM-4的更具代表性的细胞类型。
表4引物对与扩增区域寡核苷酸对相应的上游调节区HI4-19(AS)with HI4-114 -19→-114HI4-19(AS)with HI4-149 -19→-149HI4-19(AS)with HI4-206 -19→-206HI4-19(AS)with HI4-270 -19→-270HI4-19(AS)with HI4-408 -19→-408HI4-19(AS)with HI4-480 -19→-480HI4-19(AS)with HI4-560 -19→-560HI4-19(AS)with HI4-817 -19→-817向6孔平底组织培养板(Falcon)的每个孔中加入2.5×105细胞。每孔使用5微克质粒DNA双份逐孔转染COS7和NT2细胞。在37℃培养所述细胞48小时,裂解并用Luciferase Assay System(Promega)检测荧光素酶活性。
表5中总结的实验结果表明高水平的启动子活性包含在NT2细胞的ICAM-4上游调节区的-408到-19和-480到-19区中。由于NT2细胞有神经元的出发点,它们表达某些在其他细胞类型中没有发现的识别ICAM-4启动子的转录因子。在COS细胞转染子中的最高水平的启动子活性通过使用含-560到-19的核苷酸的质粒获得。尽管阳性对照pGL3 Promoter Vector在COS细胞中功能良好,其在NT2细胞中呈现很低的启动子活性,因此解释了某些启动子序列的细胞型特异性倾向。
表55’ICAM-4区的启动子活性上游区荧光COS NT2-114 到 -19 0.003 0.376-149 到 -19 0.008 0.628-206 到 -19 0.443 0.622-270 到 -19 0.056 1.140-408 到 -19 0.401 7.970-480 到 -19 0.274 4.630-560 到 -19 3.227 1.232-817 到 -19 0.035 4.453pGL3 Promoter Vector 29.0700.063pGL3 Basic Vector0.008 0.014由于COS7或NT2细胞均不正常表达ICAM-4,使用确实表达ICAM-4并基本表达ICAM-4启动子活性所需要的转录机制的原代培养大鼠海马神经元重复进行同样的实验。通过转染本文描述的各启动子结构以及其他结构进入更为自然的环境中,有可能更精确的鉴定所述上游调节区中哪些核苷酸与所述脑中ICAM-4基因的紧密调节有关。
前述解释性实施例涉及目前优选的本发明实施方案,预期本领域专业人员将做许多修饰和改动。因此只有如所附权利要求中出现的这些限制应被纳入本发明的范围。
序列表(1)一般资料(i)申请人Gallatin,W.MichaelKilgannon,Patrick D.(ii)发明题目ICAM-4物质与方法(iii)序列数42(iv)联系地址(A)联系人Marshall,O’Toole,Gerstein,Murray&Borun(B)街道233 South Wacker Drive,6300 Sears Tower(C)城市Chicago(D)洲Illinois(E)国家美国(F)邮政编码60606-6402(v)计算机可读形式(A)介质类型软盘(B)计算机IBM兼容个人计算机(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release#1.0,version#1.25(vi)当前申请资料(A)申请号(B)提交日期(C)分类(vii)优先申请资料(A)申请号US 07/827,689(B)提交日期1992年1月27日(vii)优先申请资料(A)申请号US 07/889,724(B)提交日期1992年5月26日(vii)在先申请资料(A)申请号US 07/894,061
(B)提交日期1992年6月5日(vii)在先申请资料(A)申请号US 08/009,266(B)提交日期1993年1月22日(vii)在先申请资料(A)申请号US 08/102,852(B)提交日期1993年8月5日(vii)在先申请资料(A)申请号US 08/245,295(B)提交日期1994年5月18日(vii)在先申请资料(A)申请号US 08/485,604(B)提交日期1995年6月7日(viii)律师/代理人资料(A)姓名WILLIAMS,JR.JOSEPH A.
(B)注册号38,659(C)参考/卷号27866/33321(viii)电信资料(A)电话312-474-6300(B)传真312-474-0448(C)电报25-3856(2)SEQ ID NO1资料(i)序列特征(A)长度2988碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(ix)特性(A)名称/关键字CDS(B)位置61..2814(xi)序列描述SEQ ID NO1AATTCGATCA CTCGCGCTCC CCTCGCCTTC TGCGCTCTCC CCTCCCTGGC AGCGGCGGCA 60ATG CCG GGG CCT TCA CCA GGG CTG CGC CGA ACG CTC CTC GGC CTC TGG 108Met Pro Gly Pro Ser Pro Gly Leu Arg Arg Thr Leu Leu Gly Leu Trp1 5 10 15GCT GCC CTG GGC CTG GGG ATC CTA GGC ATC TCA GCG GTC GCG CTA GAA 156Ala Ala Leu Gly Leu Gly Ile Leu Gly Ile Ser Ala Val Ala Leu Glu20 25 30CCT TTC TGG GCG GAC CTT CAG CCC CGC GTG GCG CTC GTG GAG CGC GGG 204Pro Phe Trp Ala Asp Leu Gln Pro Arg Val Ala Leu Val Glu Arg Gly35 40 45GGC TCG CTG TGG CTC AAC TGC AGC ACT AAC TGT CCG AGG CCG GAG CGC 252Gly Ser Leu Trp Leu Asn Cys Ser Thr Asn Cys Pro Arg Pro Glu Arg50 55 60GGT GGC CTG GAG ACC TCG CTA CGC CGA AAC GGG ACC CAG AGG GGT CTG 300Gly Gly Leu Glu Thr Ser Leu Arg Arg Asn Gly Thr Gln Arg Gly Leu65 70 75 80CGC TGG CTG GCT CGA CAG CTG GTG GAC ATC CGA GAG CCT GAA ACC CAG 348Arg Trp Leu Ala Arg Gln Leu Val Asp Ile Arg Glu Pro Glu Thr Gln85 90 95CCG GTC TGC TTC TTC CGC TGC GCG CGC CGC ACA CTC CAA GCG CGT GGG 396Pro Val Cys Phe Phe Arg Cys Ala Arg Arg Thr Leu Gln Ala Arg Gly100 105 110CTC ATC CGA ACT TTC CAG CGA CCG GAT CGG GTA GAG CTA GTG CCT CTG 444Leu Ile Arg Thr Phe Gln Arg Pro Asp Arg Val Glu Leu Val Pro Leu115 120 125CCT CCT TGG CAG CCT GTA GGT GAG AAC TTC ACC TTG AGC TGC AGG GTC 492Pro Pro Trp Gln Pro Val Gly Glu Asn Phe Thr Leu Ser Cys Arg Val130 135 140CCG GGG GCA GGA CCC CGA GCG AGC CTC ACA TTG ACC TTG CTG CGA GGC 540Pro Gly Ala Gly Pro Arg Ala Ser Leu Thr Leu Thr Leu Leu Arg Gly145 150 155 160GGC CAG GAG CTG ATT CGC CGA AGT TTC GTA GGC GAG CCA CCC CGA GCT 588Gly Gln Glu Leu Ile Arg Arg Ser Phe Val Gly Glu Pro Pro Arg Ala165 170 175CGG GGT GCG ATG CTC ACC GCC ACG GTC CTG GCG CGC AGA GAG GAT CAC 636Arg Gly Ala Met Leu Thr Ala Thr Val Leu Ala Arg Arg Glu Asp His180 185 190AGG GCC AAT TTC TCA TGC CTC GCG GAG CTT GAC CTG CGG CCA CAC GGC 684Arg Ala Asn Phe Ser Cys Leu Ala Glu Leu Asp Leu Arg Pro His Gly195 200 205TTG GGA CTG TTT GCA AAC AGC TCA GCC CCC AGA CAG CTC CGC ACG TTT 732Leu Gly Leu Phe Ala Asn Ser Ser Ala Pro Arg Gln Leu Arg Thr Phe210 215 220GCC ATG CCT CCA CTT TCC CCG AGC CTT ATT GCC CCA CGA TTC TTA GAA 780Ala Met Pro Pro Leu Ser Pro Ser Leu Ile Ala Pro Arg Phe Leu Glu225 230 235 240GTG GGC TCA GAA AGG CCG GTG ACT TGC ACT TTG GAT GGA CTG TTT CCT 828Val Gly Ser Glu Arg Pro Val Thr Cys Thr Leu Asp Gly Leu Phe Pro245 250 255GCC CCA GAA GCC GGG GTT TAC CTC TCT CTG GGA GAT CAG AGG CTT CAT 876Ala Pro Glu Ala Gly Val Tyr Leu Ser Leu Gly Asp Gln Arg Leu His260 265 270CCT AAT GTG ACC CTC GAC GGG GAG AGC CTT GTG GCC ACT GCC ACA GCT 924Pro Asn Val Thr Leu Asp Gly Glu Ser Leu Val Ala Thr Ala Thr Ala275 280 285ACA GCA AGT GAA GAA CAG GAA GGC ACC AAA CAG CTG ATG TGC ATC GTG 972Thr Ala Ser Glu Glu Gln Glu Gly Thr Lys Gln Leu Mer Cys Ile Val290 295 300ACC CTC GGG GGC GAA AGC AGG GAG ACC CAG GAA AAC CTG ACT GTC TAC 1020Thr Leu Gly Gly Glu Ser Arg Glu Thr Gln Glu Asn Leu Thr Val Tyr305 310 315 320AGC TTC CCG GCT CCT CTT CTG ACT TTA AGT GAG CCA GAA GCC CCC GAG 1068Ser Phe Pro Ala Pro Leu Leu Thr Leu Ser Glu Pro Glu Ala Pro Glu325 330 335GGA AAG ATG GTG ACC GTA AGC TGC TGG GCA GGG GCC CGA GCC CTT GTC 1116Gly Lys Met Val Thr Val Ser Cys Trp Ala Gly Ala Arg Ala Leu Val340 345 350ACC TTG GAG GGA ATT CCA GCT GCG GTC CCT GGG CAG CCC GCT GAG CTC 1164Thr Leu Glu Gly Ile Pro Ala Ala Val Pro Gly Gln Pro Ala Glu Leu355 360 365CAG TTA AAT GTC ACA AAG AAT GAC GAC AAG CGG GGC TTC TTC TGC GAC 1212Gln Leu Asn Val Thr Lys Asn Asp Asp Lys Arg Gly Phe Phe Cys Asp370 375 380GCT GCC CTC GAT GTG GAC GGG GAA ACT CTG AGA AAG AAC CAG AGC TCT 1260Ala Ala Leu Asp Val Asp Gly Glu Thr Leu Arg Lys Asn Gln Ser Ser385 390 395 400GAG CTT CGT GTT CTG TAC GCA CCT CGG CTG GAT GAC TTG GAC TGT CCC 1308Glu Leu Arg Val Leu Tyr Ala Pro Arg Leu Asp Asp Leu Asp Cys Pro405 410 415AGG AGC TGG ACG TGG CCA GAG GGT CCA GAG CAG ACC CTC CAC TGC GAG 1356Arg Ser Trp Thr Trp Pro Glu Gly Pro Glu Gln Thr Leu His Cys Glu420 425 430GCC CGT GGA AAC CCT GAG CCC TCC GTG CAC TGT GCA AGG CCT GAC GGT 1404Ala Arg Gly Asn Pro Glu Pro Ser Val His Cys Ala Arg Pro Asp Gly435 440 445GGG GCG GTG CTA GCG CTG GGC CTG TTG GGT CCA GTG ACC CGT GCC CTC 1452Gly Ala Val Leu Ala Leu Gly Leu Leu Gly Pro Val Thr Arg Ala Leu450 455 460GCG GGC ACT TAC CGA TGT ACA GCA ATC AAT GGG CAA GGC CAG GCG GTC 1500Ala Gly Thr Tyr Arg Cys Thr Ala Ile Asn Gly Gln Gly Gln Ala Val465 470 475 480AAG GAT GTG ACC CTG ACT GTG GAA TAT GCC CCA GCG CTG GAC AGT GTA 1548Lys Asp Val Thr Leu Thr Val Glu Tyr Ala Pro Ala Leu Asp Ser Val485 490 495GGC TGC CCA GAA CGT ATT ACT TGG CTG GAG GGG ACA GAG GCA TCG CTT 1596Gly Cys Pro Glu Arg Ile Thr Trp Leu Glu Gly Thr Glu Ala Ser Leu500 505 510AGC TGT GTG GCA CAC GGG GTC CCA CCA CCT AGC GTG AGC TGT GTG CGC 1644Ser Cys Val Ala His Gly Val Pro Pro Pro Ser Val Ser Cys Val Arg515 520 525TCT GGA AAG GAG GAA GTC ATG GAA GGG CCC CTG CGT GTG GCC CGG GAG 1692Ser Gly Lys Glu Glu Val Met Glu Gly Pro Leu Arg Val Ala Arg Glu530 535 540CAC GCT GGC ACT TAC CGA TGC GAA GCC ATC AAC GCC AGG GGA TCA GCG 1740His Ala Gly Thr Tyr Arg Cys Glu Ala Ile Asn Ala Arg Gly Ser Ala545 550 555 560GCC AAA AAT GTG GCT GTC ACG GTG GAA TAT GGT CCC AGT TTT GAG GAG 1788Ala Lys Asn Val Ala Val Thr Val Glu Tyr Gly Pro Ser Phe Glu Glu565 570 575TTG GGC TGC CCC AGC AAC TGG ACT TGG GTA GAA GGA TCT GGA AAA CTG 1836Leu Gly Cys Pro Ser Asn Trp Thr Trp Val Glu Gly Ser Gly Lys Leu580 585 590TTT TCC TGT GAA GTT GAT GGG AAG CCG GAA CCA CGC GTG GAG TGC GTG 1884Phe Ser Cys Glu Val Asp Gly Lys Pro Glu Pro Arg Val Glu Cys Val595 600 605GGC TCG GAG GGT GCA AGC GAA GGG GTA GTG TTG CCC CTG GTG TCC TCG 1932Gly Ser Glu Gly Ala Ser Glu Gly Val Val Leu Pro Leu Val Ser Ser610 615 620AAC TCT GGT TCC AGA AAC TCT ATG ACT CCT GGT AAC CTG TCA CCG GGT 1980Asn Ser Gly Ser Arg Asn Ser Met Thr Pro Gly Asn Leu Ser Pro Gly625 630 635 640ATT TAC CTC TGC AAC GCC ACC AAC CGG CAT GGC TCC ACA GTC AAA ACA 2028Ile Tyr Leu Cys Asn Ala Thr Asn Arg His Gly Ser Thr Val Lys Thr645 650 655GTC GTC GTG AGC GCG GAA TCA CCG CCA CAG ATG GAT GAA TCC AGT TGC 2076Val Val Val Ser Ala Glu Ser Pro Pro Gln Met Asp Glu Ser Ser Cys660 665 670CCG AGT CAC CAG ACA TGG CTG GAA GGA GCC GAG GCT ACT GCG CTG GCC 2124Pro Ser His Gln Thr Trp Leu Glu Gly Ala Glu Ala Thr Ala Leu Ala675 680 685TGC AGT GCC AGA GGC CGC CCC TCT CCA CGC GTG CGC TGT TCC AGG GAA 2172Cys Ser Ala Arg Gly Arg Pro Ser Pro Arg Val Arg Cys Ser Arg Glu690 695 700GGT GCA GCC AGG CTG GAG AGG CTA CAG GTG TCC CGA GAG GAT GCG GGG 2220Gly Ala Ala Arg Leu Glu Arg Leu Gln Val Ser Arg Glu Asp Ala Gly705 710 715 720ACC TAC CTG TGT GTG GCT ACC AAC GCG CAT GGC ACG GAT TCA CGG ACC 2268Thr Tyr Leu Cys Val Ala Thr Asn Ala His Gly Thr Asp Ser Arg Thr725 730 735GTC ACT GTG GGT GTG GAA TAC CGG CCT GTG GTG GCT GAG CTG GCA GCC 2316Val Thr Val Gly Val Glu Tyr Arg Pro Val Val Ala Glu Leu Ala Ala740 745 750TCG CCC CCA AGC GTG CGG CCT GGC GGA AAC TTC ACT CTG ACC TGC CGT 2364Ser Pro Pro Ser Val Arg Pro Gly Gly Asn Phe Thr Leu Thr Cys Arg755 760 765GCA GAG GCC TGG CCT CCA GCC CAG ATC AGC TGG CGC GCG CCC CCG GGA 2412Ala Glu Ala Trp Pro Pro Ala Gln Ile Ser Trp Arg Ala Pro Pro Gly770 775 780GCT CTC AAC CTC GGT CTC TCC AGC AAC AAC AGC ACG CTG AGC GTG GCG 2460Ala Leu Asn Leu Gly Leu Ser Ser Asn Asn Ser Thr Leu Ser Val Ala785 790 795 800GGT GCC ATG GGC AGC CAT GGT GGC GAG TAT GAG TGC GCA GCC ACC AAT 2508Gly Ala Met Gly Ser His Gly Gly Glu Tyr Glu Cys Ala Ala Thr Asn805 810 815GCG CAT GGG CGC CAC GCA CGG CGC ATC ACG GTG CGC GTG GCC GGT CCA 2556Ala His Gly Arg His Ala Arg Arg Ile Thr Val Arg Val Ala Gly Pro820 825 830TGG CTG TGG GTC GCT GTG GGC GGT GCG GCA GGG GGC GCG GCG CTG CTG 2604Trp Leu Trp Val Ala Val Gly Gly Ala Ala Gly Gly Ala Ala Lsu Leu835 840 845GCC GCA GGG GCC GGC CTG GCC TTC TAC GTG CAG TCC ACC GCT TGC AAG 2652Ala Ala Gly Ala Gly Leu Ala Phe Tyr Val Gln Ser Thr Ala Cys Lys850 855 860AAG GGA GAG TAC AAC GTC CAG GAG GCT GAG AGC TCA GGC GAG GCG GTG 2700Lys Gly Glu Tyr Asn Val Gln Glu Ala Glu Ser Ser Gly Glu Ala Val865 870 875 880TGT CTC AAT GGC GCG GGC GGG ACA CCG GGT GCA GAA GGC GGA GCA GAG 2748Cys Leu Asn Gly Ala Gly Gly Thr Pro Gly Ala Glu Gly Gly Ala Glu885 890 895ACC CCC GGC ACT GCC GAG TCA CCT GCA GAT GGC GAG GTT TTC GCC ATC 2796Thr Pro Gly Thr Ala Glu Ser Pro Ala Asp Gly Glu Val Phe Ala Ile900 905 910CAG CTG ACA TCT TCC TGAGCCTGTA TCCAGCTCCC CCAGGGGCCT CGAAAGCACA 2851Gln Leu Thr Ser Ser915GGGGTGGACG TATGTATTGT TCACTCTCTA TTTATTCAAC TCCAGGGGCG TCGTCCCCGT 2911TTTCTACCCA TTCCCTTAAT AAAGTTTTTA TAGGAGAAAA AAAAAAAAAA AAAAAAAAAA 2971AAAAAAAAAA AAAAAAA2988(2)SEQ ID NO2资料(i)序列特征(A)长度917氨基酸(B)类型氨基酸(C)拓扑结构线形(ii)分子类型蛋白质(xi)序列描述SEQ ID NO2Met Pro Gly Pro Ser Pro Gly Leu Arg Arg Thr Leu Leu Gly Leu Trp1 5 10 15Ala Ala Leu Gly Leu Gly Ile Leu Gly Ile Ser Ala Val Ala Leu Glu20 25 30Pro Phe Trp Ala Asp Leu Gln Pro Arg Val Ala Leu Val Glu Arg Gly35 40 45Gly Ser Leu Trp Leu Asn Cys Ser Thr Asn Cys Pro Arg Pro Glu Arg50 55 60Gly Gly Leu Glu Thr Ser Leu Arg Arg Asn Gly Thr Gln Arg Gly Leu65 70 75 80Arg Trp Leu Ala Arg Gln Leu Val Asp Ile Arg Glu Pro Glu Thr Gln85 90 95Pro Val Cys Phe Phe Arg Cys Ala Arg Arg Thr Leu Gln Ala Arg Gly100 105 110Leu Ile Arg Thr Phe Gln Arg Pro Asp Arg Val Glu Leu Val Pro Leu115 120 125Pro Pro Trp Gln Pro Val Gly Glu Asn Phe Thr Leu Ser Cys Arg Val130 135 140Pro Gly Ala Gly Pro Arg Ala Ser Leu Thr Leu Thr Leu Leu Arg Gly145 150 155160Gly Gln Glu Leu Ile Arg Arg Ser Phe Val Gly Glu Pro Pro Arg Ala165 170 175Arg Gly Ala Met Leu Thr Ala Thr Val Leu Ala Arg Arg Glu Asp His180 185 190Arg Ala Asn Phe Ser Cys Leu Ala Glu Leu Asp Leu Arg Pro His Gly195 200 205Leu Gly Leu Phe Ala Asn Ser Ser Ala Pro Arg Gln Leu Arg Thr Phe210 215 220Ala Met Pro Pro Leu Ser Pro ser Leu Ile Ala Pro Arg Phe Leu Glu225 230 235 240Val Gly Ser Glu Arg Pro Val Thr Cys Thr Leu Asp Gly Leu Phe Pro245 250 255Ala Pro Glu Ala Gly Val Tyr Leu Ser Leu Gly Asp Gln Arg Leu His260 265 270Pro Asn Val Thr Leu Asp Gly Glu Ser Leu Val Ala Thr Ala Thr Ala275 280 285Thr Ala Ser Glu Glu Gln Glu Gly Thr Lys Gln Leu Met Cys Ile Val290 295 300Thr Leu Gly Gly Glu Ser Arg Glu Thr Gln Glu Asn Leu Thr Val Tyr305 310 315 320Ser Phe Pro Ala Pro Leu Leu Thr Leu Ser Glu Pro Glu Ala Pro Glu325 330 335Gly Lys Met Val Thr Val Ser Cys Trp Ala Gly Ala Arg Ala Leu Val340 345 350Thr Leu Glu Gly Ile Pro Ala Ala Val Pro Gly Gln Pro Ala Glu Leu355 360 365Gln Leu Asn Val Thr Lys Asn Asp Asp Lys Arg Gly Phe Phe Cys Asp370 375 380Ala Ala Leu Asp Val Asp Gly Glu Thr Leu Arg Lys Asn Gln Ser Ser385 390 395 400Glu Leu Arg Val Leu Tyr Ala Pro Arg Leu Asp Asp Leu Asp Cys Pro405 410 415Arg Ser Trp Thr Trp Pro Glu Gly Pro Glu Gln Thr Leu His Cys Glu420 425 430Ala Arg Gly Asn Pro Glu Pro Ser Val His Cys Ala Arg Pro Asp Gly435 440 445Gly Ala Val Leu Ala Leu Gly Leu Leu Gly Pro Val Thr Arg Ala Leu450 455 460Ala Gly Thr Tyr Arg Cys Thr Ala Ile Asn Gly Gln Gly Gln Ala Val465 470 475 480Lys Asp Val Thr Leu Thr Val Glu Tyr Ala Pro Ala Leu Asp Ser Val485 490 495Gly Cys Pro Glu Arg Ile Thr Trp Leu Glu Gly Thr Glu Ala Ser Leu500 505 510Ser Cys Val Ala His Gly Val Pro Pro Pro Ser Val Ser Cys Val Arg515 520 525Ser Gly Lys Glu Glu Val Met Glu Gly Pro Leu Arg Val Ala Arg Glu530 535 540His Ala Gly Thr Tyr Arg Cys Glu Ala Ile Asn Ala Arg Gly Ser Ala545 550 555 560Ala Lys Asn Val Ala Val Thr Val Glu Tyr Gly Pro Ser Phe Glu Glu565 570 575Leu Gly Cys Pro Ser Asn Trp Thr Trp Val Glu Gly Ser Gly Lys Leu580 585 590Phe Ser Cys Glu Val Asp Gly Lys Pro Glu Pro Arg Val Glu Cys Val595 600 605Gly Ser Glu Gly Ala Ser Glu Gly Val Val Leu Pro Leu Val Ser Ser610 615 620Asn Ser Gly Ser Arg Asn Ser Met Thr Pro Gly Asn Leu Ser Pro Gly625 630 635 640Ile Tyr Leu Cys Asn Ala Thr Asn Arg His Gly Ser Thr Val Lys Thr645 650 655Val Val Val Ser Ala Glu Ser Pro Pro Gln Met Asp Glu Ser Ser Cys660 665 670Pro Ser His Gln Thr Trp Leu Glu Gly Ala Glu Ala Thr Ala Leu Ala675 680 685Cys Ser Ala Arg Gly Arg Pro Ser Pro Arg Val Arg Cys Ser Arg Glu690 695 700Gly Ala Ala Arg Leu Glu Arg Leu Gln Val Ser Arg Glu Asp Ala Gly705 710715 720Thr Tyr Leu Cys Val Ala Thr Asn Ala His Gly Thr Asp Ser Arg Thr725 730 735Val Thr Val Gly Val Glu Tyr Arg Pro Val Val Ala Glu Leu Ala Ala740 745 750Ser Pro Pro Ser Val Arg Pro Gly Gly Asn Phe Thr Leu Thr Cys Arg755 760 765Ala Glu Ala Trp Pro Pro Ala Gln Ile Ser Trp Arg Ala Pro Pro Gly770 775 780Ala Leu Asn Leu Gly Leu Ser Ser Asn Asn Ser Thr Leu Ser Val Ala785 790 795 800Gly Ala Met Gly Ser His Gly Gly Glu Tyr Glu Cys Ala Ala Thr Asn805 810 815Ala His Gly Arg His Ala Arg Arg Ile Thr Val Arg Val Ala Gly Pro820 825 830Trp Leu Trp Val Ala Val Gly Gly Ala Ala Gly Gly Ala Ala Leu Leu835 840 845Ala Ala Gly Ala Gly Leu Ala Phe Tyr Val Gln Ser Thr Ala Cys Lys850 855 860Lys Gly Glu Tyr Asn Val Gln Glu Ala Glu Ser Ser Gly Glu Ala Val865 870 875 880Cys Leu Asn Gly Ala Gly Gly Thr Pro Gly Ala Glu Gly Gly Ala Glu885 890 895Thr Pro Gly Thr Ala Glu Ser Pro Ala Asp Gly Glu Val Phe Ala Ile900 905 910Gln Leu Thr Ser Ser915(2)序列资料 SEQ ID NO3(i)序列特征(A)长度315碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(基因组)(ix)特性(A)名称/关键字CDS(B)位置1..315(xI)序列描述SEQ ID NO3CCG GAT CGG GTA GAG CTA GTG CCT CTG CCT CCT TGG CAG CCT GTA GGT 48Pro Asp Arg Val Glu Leu Val Pro Leu Pro Pro Trp Gln Pro Val Gly1 5 10 15GAG AAC TTC ACC TTG AGC TGC AGG GTC CCG GGG GCA GGA CCC CGA GCG 96Glu Asn Phe Thr Leu Ser Cys Arg Val Pro Gly Ala Gly Pro Arg Ala20 25 30AGC CTC ACA TTG ACC TTG CTG CGA GGC GGA CAG GAG CTG ATT CGC CGA 144Ser Leu Thr Leu Thr Leu Leu Arg Gly Gly Gln Glu Leu Ile Arg Arg35 40 45AGT TTC GTA GGC GAG CCA CCC CGA GCT CGG TGT GCG ATG CTC ACC GCC 192Ser Phe Val Gly Glu Pro Pro Arg Ala Arg Cys Ala Met Leu Thr Ala50 55 60ACG GTC CTG GCG CGC AGA GAG GAT CAC AGG GAC AAT TTC TCA TGC CTC 240Thr Val Leu Ala Arg Arg Glu Asp His Arg Asp Asn Phe Ser Cys Leu65 70 75 80GCG GAG CcTT GAC CTG CGG ACA CAC GGC TTG GGA CTG TTT GCA AAC AGC 288Ala Glu Leu Asp Leu Arg Thr His Gly Leu Gly Leu Phe Ala Asn Ser85 90 95TCA GCC CCC AGA CAG CTC CGC ACG TTT 315Ser Ala Pro Arg Gln Leu Arg Thr Phe100 105(2)序列资料 SEQ ID NO4(i)序列特征(A)长度178l碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(ix)特性(A)名称/关键字CDS(B)位置16..1659(xi)序列描述SEQ ID NO4CAGCTCTCTG TCAGA ATG GCC ACC ATG GTA CCA TCC GTG TTG TGG CCC AGG51Met Ala Thr Met Val Pro Ser Val Leu Trp Pro Arg1 5 10GCC TGC TGG ACT CIG CTG GTC TGC TGT CTG CTG ACC CCA GGT GTC CAG 99Ala Cys Trp Thr Leu Leu Val Cys Cys Leu Leu Thr Pro Gly Val Gln15 20 25GGG CAG GAG TTC CTT TTG CGG GTG GAG CCC CAG AAC CCT GTG CTC TCT147Gly Gln Glu Phe Leu Leu Arg Val Glu Pro Gln Asn Pro Val Leu Ser30 35 40GCT GGA GGG TCC CTG TTT GTG AAC TGC AGT ACT GAT TGT CCC AGC TCT195Ala Gly Gly Ser Leu Phe Val Asn Cys Ser Thr Asp Cys Pro Ser Ser45 50 55 60GAG AAA ATC GCC TTG GAG ACG TCC CTA TCA AAG GAG CTG GTG GCC AGT243Glu Lys Ile Ala Leu Glu Thr Ser Leu Ser Lys Glu Leu Val Ala Ser65 70 75GGC ATG GGC TGG GCA GCC TTC AAT CTC AGC AAC GTG ACT GGC AAC AGT291Gly Met Gly Trp Ala Ala Phe Asn Leu Ser Asn Val Thr Gly Asn Ser80 85 90CGG ATC CTC TGC TCA GTG TAC TGC AAT GGC TCC CAG ATA ACA GGC TCC339Arg Ile Leu Cys Ser Val Tyr Cys Asn Gly Ser Gln Ile Thr Gly Ser95 100 105TCT AAC ATC ACC GTG TAC GGG CTC CCG GAG CGT GTG GAG CTG GCA CCC387Ser Asn Ile Thr Val Tyr Gly Leu Pro Glu Arg Val Glu Leu Ala Pro110 115 120CTG CCT CCT TGG CAG CCG GTG GGC CAG AAC TTC ACC CTG CGC TGC CAA435Leu Pro Pro Trp Gln Pro Val Gly Gln Asn Phe Thr Leu Arg Cys Gln125 130 135 140GTG GAG GGT GGG TCG CCC CGG ACC AGC CTC ACG GTG GTG CTG CTT CGC483Val Glu Gly Gly Ser Pro Arg Thr Ser Leu Thr Val Val Leu Leu Arg145 150 155TGG GAG GAG GAG CTG AGC CGG CAG CCC GCA GTG GAG GAG CCA GCG GAG531Trp Glu Glu Glu Leu Ser Arg Gln Pro Ala Val Glu Glu Pro Ala Glu160 165 170GTC ACT GCC ACT GTG CTG GCC AGC AGA GAC GAC CAC GGA GCC CCT TTC579Val Thr Ala Thr Val Leu Ala Ser Arg Asp Asp His Gly Ala Pro Phe175 180 185TCA TGC CGC ACA GAA CTG GAC ATG CAG CCC CAG GGG CTG GGA CTG TTC627Ser Cys Arg Thr Glu Leu Asp Met Gln Pro Gln Gly Leu Gly Leu Phe190 195 200GTG AAC ACC TCA GCC CCC CGC CAG CTC CGA ACC TTT GTC CTG CCC GTG675Val Asn Thr Ser Ala Pro Arg Gln Leu Arg Thr Phe Val Leu Pro Val205 210 215 220ACC CCC CCG CGC CTC GTG GCC CCC CGG TTC TTG GAG GTG GAA ACG TCG723Thr Pro Pro Arg Leu Val Ala Pro Arg Phe Leu Glu Val Glu Thr Ser225 230 235TGG CCG GTG GAC TGC ACC CTA GAC GGG CTT TTT CCA GCC TCA GAG GCC771Trp Pro Val Asp Cys Thr Leu Asp Gly Leu Phe Pro Ala Ser Glu Ala240 245 250CAG GTC TAC CTG GCG CTG GGG GAC CAG ATG CTG AAT GCG ACA GTC ATG 819Gln Val Tyr Leu Ala Leu Gly Asp Gln Met Leu Asn Ala Thr Val Met255 260 265AAC CAC GGG GAC ACG CTA ACG GCC ACA GCC ACA GCC ACG GCG CGC GCG 867Asn His Gly Asp Thr Leu Thr Ala Thr Ala Thr Ala Thr Ala Arg Ala270 275 280GAT CAG GAG GGT GCC CGG GAG ATC GTC TGC AAC GTG ACC CTA GGG GGC 915Asp Gln Glu Gly Ala Arg Glu Ile Val Cys Asn Val Thr Leu Gly Gly285 290 295 300GAG AGA CGG GAG GCC CGG GAG AAC TTG ACG GTC TTT AGC TTC CTA GGA 963Glu Arg Arg Glu Ala Arg Glu Asn Leu Thr Val Phe Ser Phe Leu Gly305 310 315CCC ATT GTG AAC CTC AGC GAG CCC ACC GCC CAT GAG GGG TCC ACA GTG 1011Pro Ile Val Asn Leu Ser Glu Pro Thr Ala His Glu Gly Ser Thr Val320 325 330ACC GTG AGT TGC ATG GCT GGG GCT CGA GTC CAG GTC ACG CTG GAC GGA 1059Thr Val Ser Cys Met Ala Gly Ala Arg Val Gln Val Thr Leu Asp Gly335 340 345GTT CCG GCC GCG GCC CCG GGG CAG ACA GCT CAA CTT CAG CTA AAT GCT 1107Val Pro Ala Ala Ala Pro Gly Gln Thr Ala Gln Leu Gln Leu Asn Ala350 355 360ACC GAG AGT GAC GAC GGA CGC AGC TTC TTC TGC AGT GCC ACT CTC GAG 1155Thr Glu Ser Asp Asp Gly Arg Ser Phe Phe Cys Ser Ala Thr Leu Glu365 370 375 380GTG GAC GGC GAG TTC TTG CAC AGG AAC AGT AGC GTC CAG CTG CGA GTC 1203Val Asp Gly Glu Phe Leu His Arg Asn Ser Ser Val Gln Leu Arg Val385 390 395CTG TAT GGT CCC AAA ATT GAC CGA GCC ACA TGC CCC CAG CAC TTG AAA 1251Leu Tyr Gly Pro Lys Ile Asp Arg Ala Thr Cys Pro Gln His Leu Lys400 405 410TGG AAA GAT AAA ACG AGA CAC GTC CTG CAG TGC CAA GCC AGG GGC AAC 1299Trp Lys Asp Lys Thr Arg His Val Leu Gln Cys Gln Ala Arg Gly Asn415 420 425CCG TAC CCC GAG CTG CGG TGT TTG AAG GAA GGC TCC AGC CGG GAG GTG 1347Pro Tyr Pro Glu Leu Arg Cys Leu Lys Glu Gly Ser Ser Arg Glu Val430 435 440CCG GTG GGG ATC CCG TTC TTC GTC AAC GTA ACA CAT AAT GGT ACT TAT 1395Pro Val Gly Ile Pro Phe Phe Val Asn Val Thr His Asn Gly Thr Tyr445 450 455 460CAG TGC CAA GCG TCC AGC TCA CGA GGC AAA TAC ACC CTG GTC GTG GTG 1443Gln Cys Gln Ala Ser Ser Ser Arg Gly Lys Tyr Thr Leu Val Val Val465 470 475ATG GAC ATT GAG GCT GGG AGC TCC CAC TTT GTC CCC GTC TTC GTG GCG 1491Met Asp Ile Glu Ala Gly Ser Ser His Phe Val Pro Val Phe Val Ala480 485 490GTG TTA CTG ACC CTG GGC GTG GTG ACT ATC GTA CTG GCC TTA ATG TAC 1539Val Leu Leu Thr Leu Gly Val Val Thr Ile Val Leu Ala Leu Met Tyr495 500 505GTC TTC AGG GAG CAC CAA CGG AGC GGC AGT TAC CAT GTT AGG GAG GAG 1587Val Phe Arg Glu His Gln Arg Ser Gly Ser Tyr His Val Arg Glu Glu510 515 520AGC ACC TAT CTG CCC CTC ACG TCT ATG CAG CCG ACA GAA GCA ATG GGG 1635Ser Thr Tyr Leu Pro Leu Thr Ser Met Gln Pro Thr Glu Ala Met Gly525 530 535 540GAA GAA CCG TCC AGA GCT GAG TGACGCTGGG ATCCGGGATC AAAGTTGGCG 1686Glu Glu Pro Ser Arg Ala Glu545GGGGCTTGGC TGTGCCCTCA GATTCCGCAC CAATAAAGCC TTCAAACTCC CAAAAAAAAA1746AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAA 1781(2)序列资料SEQ ID NO5(i)序列特征(A)长度4900碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO5CCGAACGCTC CTCGGCCTCT GGTCTNCTCT GGNCCTGGGG ATCCTAGGCA TCTCAGGTAA 60GAAGAGCCCG CCCGTGGAGC NAGGTGGATA AGGCGGGGGC GGAATTGAAG GACCAGAGAG 120GGCGGCCCGG GTGTCCCCCT CCAGGCTCCG CCCTCTTCTA GCTTCCCACG CTTCTGTCAC 180CACCTGGAGN TCGGGGCTTC TCCCCGTCCT TCCTCCACCC CAACACACCT CAATCTTTCA 240GANCTGAACC CAGCACCTTT TCTGGANTNG GGGNNTTGCA CCTAACCTGT CTCAGGAGAN 300ACTGTGGCTC TCCTGTCCTC TCCTGCTCTG TNATGCCCTA TGGTTCACAG ACTGGCATCA 360TCCCTATTCA TGATCCTCAA AGACNCCATC TCCTCAACTG TCATAACTCA GAGCTCTATT 420CCCCCTCCAC CTGGAGCCCT GGAAACCGGC TTTCTAGGGC TTTTCTCCGC GGTTCTTTCC 480CGGAGTTCAG CGTTGTGGCT TTTTGTCCAA GTTACTCAAG TTTGGGGACA ATCTCCTTTA 540AGCCTTTGAC TCAGTCTCAT TTCCACTTTG CTTTTGCCCC AAGCCTCTGT GTCTCTCCCC 600CATTTCCTGA CGATCTGTCA GAGTCTTAAG AGTGATTTGG TTCCCCATCC CCCCTCCAAC 660TGGAGTCTCC TCCTCACTAT TGATGTGTGC ATCTGAGACC CCCATCCCCG CACCGAGTTT 720CCCCATCTCT GTCAGTAAAG AGCAAGGCTT CCAGAGACAA CCCTCTAATA GCGCGTCAGT 780CCCGAATCTT GAGTGGGATG CGGGACTCCC GTGCTATTTC TTGGCGGAGG TCTTTCCTGG 840TCCTTATGGA CACCCCTGGT TTGGGATATG GGGGCCGCTA AGATTTCAGA GATGGGGTCC 900CTAGGCTGAG NCCGCGTTTT CCCGGGCAGC GGTCGCGCTA GAACCTTTCT GGGCGGACCT 960TCAGCCCCGC GTGGCGCTCG TGGAGCGCGG GGGCTCGCTG TGGCTCAACT GCAGCACTAA1020CTGTCCGAGG CCGGAGCGCG GTGGCCTGGA GACCTCGCTA CGCCGAAACG GGACCCAGAG1080GGGTCTGNAC TGNCTGGCTC GACAGCTGGT GGACATCCGA GANCCTGAAA CCCAGCCGGT1140CTGCTTCTTC CNCTGCGCGC GCCGCACACT CCAAGCGCGT GGGCTCATCC GAACTTTCCG1200TGAGTTCAGG GTGGGCACNC CCCTTGGGTC TCTGGACCTC CCCCTCAAGC TCCTCCCACC1260CGCCCTCTGA TCCTCCTGCT TGTTCTGAAA GTACTACAGC TGGCTAGAGC GGAGTTTTTG1320GTCCCTTGCA GAGCGACCGG ATCGGGTAGA GCTAGTGCCT CTGCCTCCTT GGCAGCCTGT1380AGGTGAGAAC TTCACCTTGA GCTGCAGGGT CCCGGGGGCA GGACCCCGAG CGAGCCTCAC1440ATTGACCTTG CTGCGAGGCG GCCAGGAGCT GATTCGCCGA AGTTTCGTAG GCGAGCCACC1500CCGAGCTCGG GGTGCGATGC TCACCGCCAC GGTCCTGGCG CGCAGAGAGG ATCACAGGGC1560CAATTTCTCA TGCCTCGCGG AGCTTGACCT GCGNCCACAC GGCTTGGGAC TGTTTGCANA1620CAGCTCAGCC CCCAGACAGC TCCGCACGTT TGGTGAGTGT GGACCCTAAC TGACAGATTT1680TAAGAAGTTT AGGGCAGCCA GGCGTGGTGG CATGGTGTCG TAGGCCCTAA GTCCCAGCCC1740AAGCAGANCT AAGNCGGATC TCTTGTGAAT TAAAAGTCTA GCTCGTCTAC ATAACGAGGN1800CTGCATAGTT AAATCCCCCA AAAGTCTAAG CAGCTAGCCC TTACTTCCAA CACAAGTACT1860AGCTTAAGTA CTTTCTCCTG TGAGCTTTTT CCTTTATGTA TTTACTCGTT GAGAGAAAAA1920GAGAGTGTGT GTACGTGCCT TTATGCACAT GCCGCAGTGC TTGTATGGAA GTTAAAGAAT1980AAGGAGGCGT TCTGCCCTTC CATCCTGTGG GTCCTAGGGG TGGTATTAGC TCCTCAGGCT2040TTGTTAGTNA CAAGCGCCTA GGCTTGGGGA GCCATCTCGC CCGCTCCTCT GTATCTTTAG2100GGTGAAACCA GACAATGCAT GCAAATTGGT TGATCAACAC TGAATGTTTA GTTCGTAAAT2160TCAAGCTCTG TTCTTTGTCT TCCTCAGCCA TGCCTCCACT TTCCCCCGAG CCTTATTGCC2220CCACGATTCT TAGAAGTGGG CTCAGAAAGG CCGGTGACKT GCACTTTGGA TGGACTGTTT2280CCTGCCCCAG AAGCCGGGGT TTACTTCTCT CTGGGAGATC AGAGGCTTCA TCCTAATGTG2340ACCCTCGACG GGGAGAGCCT TGTGGCCACT GCCACAGCTA CAGCAAGTGA AGAACAGGAA2400GGCACCAAAC AGCTGATGTG CATCGTGACC CTCGGGGGCG AAAGCAGGGA GACCCAGGAA2460AACCTGACTG TCTACAGTAA GGGGAATCCA ACAAGACCTT CAATAGCTCA GACTGGGGCT2520GGGGCTGGGT CTGGGTCTGG GGCCAGAGTC TCACAAAGGC GGAGCCTATA AAGTGGGCGG2580GACCTCCACA CCAGAACAAG CCGGGCGGGA GAGTTCCAGG GCAGGAGCAG ATAGAAGTTG2640GAAATTAATA GATTGGGTTG AGTTCCCTGA GTGGGGAGTG AACCCCACCC AATTCTCTGT2700CCCCAGGCTT CCCGGCTCCT CTTCTGACTT TAAGTGAGCC AGAAGCCCCC GAGGGAAAGA2760TGGTGACCGT AAGCTGCTGG GCAGGGGCCC GAGCCCTTGT CACCTTGGAG GGAATTCCAA2820GGACCCTCTT ACCGGCCCCA TCTTTAACCT TATCGTATCC CCTCTGCCTC ATGCCCGCAG2880ACGCACCTCG GCTGGATGAC TTGGACTGTC CCAGGAGCTG GACGTGGCCA GAGGGTCCAG2940AGCAGACCCT CCACTGCGAG GCCCGTGGAA ACCCTGAGCC CTCCGTGCAC TGTGCAAGGC3000CTGACGGTGG GGCGGTGCTA GCGCTGGGCC TGTTGGGTCC AGTGACCCGT GCCCTCGCGG3060GCACTTACCG ATGTACAGCA ATCAATGGGC AAGGCCAGGC GGTCAAGGAT GTGACCCTGA3120CTGTGGAATG TGAGTAGGGG GAGGTGGGCA TGCTTATCCC TTTAAGGTCA CGGAGTGTAC3180TGGGAGACTG GCTATACGGA AAGGAAAGAA GCCTAGGTTC AGCAGGGATT GGGAAAACAC3240TGAAGGAAAG TGGTGTGGTG TTTACAAACT TAACGGTGGT AACTGGGCAC GGTCTGGCAA3300AAACAGACAG CCAAGAGAGT GTGCCTGGGA AGCTGCAATG GGGGCTTTGT GGGAATTGGT3360CAACAGCACC CTGAGATCTC AGGAAAGGGG CCTGAAGTTA TCTCCAGAAC CCATGTGAAG3420GCAGGAAGAG AGAACGCCCA CCTTTTCCTG CTCCCCCCAA CCCCCCCCCA CATATCACAC3480GGAGTATATA AATAAATAAA ATGGCTCCTG CCGGAGGGAG TGAGAAGCTG TCTCCTGCAG3540GCTCAGAGCA GTGGTAGTGC ATGCCTTTAA TCCCAGCACT CGGTAGGCAA AGGCAGGCAG3600ATCTCTGTGA ATGTGGGGCC AGCCTGGTCT GTACAGAGAA ATCCTGTCTC AAAACAAACC3660AGCAAAGAAA CAAAACCAAA ATCAATTCCA GATGCCCCAG CGCTGGACAG TGTAGGCTGC3720CCANGACGTA TTACTTGNCT GGAGGGGACA GAGGCATCGC TTAGCTGTGT GGCACACGGG3780GTCCCACCAC CTAGCGTGAG CTGTGTGCGC TCTGGAAAGG AGGAAGTCAT GGAAGGGCCC3840CTGCGTGTGG CCCGGGAGCA CGCTGGCACT TACCGATGCG AAGCCATCAA CGCCAGGGGA3900TCAGCGGNCA AAAATGTGGC TGTCACGGTG GAATGTGAGT AGGGGTGGCT ACGGAAATGT3960CCACACCTGC GTCCTCTGTC CTCAGTGTGA ACTCCTATTT CCCTGCTTCC TAGATGGTCC4020CAGTTNTGAG GAGTTGGGCT GCCCCAGCAA CTGGACTTGG GTAGAAGGAT CTGGAAAACT4080GTTTTCCTGT GAAGTTGATG GGAAGCCGGA ACCACGCGTG GAGTGCGTGG GCTCGGAGGG4140TGCAAGCGAA GGGGTAGTGT TGCCCCTGGT GTCCTCGAAC TCTGGTTCCA GAAACTCTAT4200GACTCCTGGT AACCTGTCAC CGGGTATTTA CCTCTGCAAC GCCACCAACC GGCATGGCTC4260CACAGTCAAA ACAGTCGTCG TGAGCGCGGA ATGTGAGCAG GGGCCCAGGT GGGCGGAGAG4320TACCGGGTGT CCCAGGATCT TTTCTTTCCC TGATGCCCCT CCTTATGGTG GCTGATCTGC4380AGCACCGCCA CAGATGGATG AATCCAGTTG CCCGAGTCAC CAGACATGGC TGGAAGGAGC4440CGAGGCTACT GCGCTGGCCT GCAGTGACAG GGGNCGCCCC TCTCCACGCG TGCGCTGTTC4500CAGGGAAGGT GCAGCCAGGC TGGAGAGGCT ACAGGTGTCC CGAGAGGATG CGGGGACCTA4560CCTGTGTGTG GCTACCAACG CGCATGGCAC GGATTCACGG ACCGTCACTG TGGGTGTGGA4620ATGTGAGTGA GGACAGCGCT GAATGAAGAC GACTCAGACC GCCAGAAAAG TGCCTTGAGG4680CCTGGGATGT ATGATCCAGT GGGTAGAGTG CTCAATTAGC ACTCACTAAA ATGTATATTC4740TATTCCTAAT ACTCTTTAAT TTTANCCTTT GGGAGGCAGA GACAGGCAGA TCTCTGTTCC4800GGGATAACCT GCTCTCTGTC TAGGACAGCT TGGTCTACAG AGGGGNTACA GGCCCCCCCT4860CCCAAGATTG NATAGCAACC CTCTGGCTCC CTGTCTCTCT 4900(2)序列资料SEQ ID NO6(i)序列特征(A)长度1295碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(iii)分子类型cDNA(xi)序列描述SEQ ID NO6NGAATTCCGG CGGATCGGGT AGAGCTAGTG CCTCTGCCTC CTTGGCAGCC TGTAGGTGAG 60AACTTCACCT TGAGCTGCAG GGTCCCGGGG GCAGGACCCC GAGCGAGCCT CACATTGACC 120TTGCTGCGAG GCGGCCAGGA GCTGATTCGC CGAAGTTTCG TAGGCGAGCC ACCCCGAGCT 180CGGGGTGCGA TGCTCACCGC CACGGTCCTG GCGCGCAGAG AGGATCACAG GGCCAATTTC 240TCATGCCTCG CGGAGCTTGA CCTGCGGCCA CACGGCTTGG GACTGTTTGC AAACAGCTCA 300GCCCCCAGAC AGCTCCGCAC GTTTGCCATG CCTCCACTTT CCCCGAGCCT TATTGCCCCA 360CGATTCTTAG AAGTGGGCTC AGAAAGGCCG GTGACTTGCA CTTTGGATGG ACTGTTTCCT 420GCCCCAGAAG CCGGGGTTTA CCTCTCTCTG GGAGATCAGA GGCTTCATCC TAATGTGACC 480CTCGACGGGG AGAGCCTTGT GGCCACTGCC ACAGCTACAG CAAGTGAAGA ACAGGAAGGC 540ACCAAACAGC TGATGTGCAT CGTGACCCTC GGGGGCGAAA GCAGGGAGAC CCAGGAAAAC 600CTGACTGTCT ACAGCTTCCC GGCTCCTCTT CTGACTTTAA GTGAGCCAGA AGCCCCCGAG 660GGAAAGATGG TGACCGTAAG CTGCTGGGCA GGGGCCCGAG CCCTTGTCAC CTTGGAGGGA 720ATTCCAAGGA CCCTCTTACC GGCCCCATCT TTAACCTTAT CGTATCCCCT CTGCCTCATG 780CCCGCAGACG CACCTCGGCT GGATGACTTG GACTGTCCCA GGAGCTGGAC GTGGCCAGAG 840GGTCCAGAGC AGACCCTCCA CTGCGAGGCC CGTGGAAACC CTGAGCCCTC CGTGCACTGT 900GCAAGGCCTG ACGGTGGGGC GGTGCTAGCG CTGGGCCTGT TGGGTCCAGT GACCCGTGCC 960CTCGCGGGCA CTTACCGATG TACAGCAATC AATGGGCAAG GCCAGGCGGT CAAGGATGTG 1020ACCCTGACTG TGGAATATGC CCCAGCGCTG GACAGTGTAG GCTGCCCAGA ACGTATTACT 1080TGGCTGGAGG GGACAGAGGC ATCGCTTAGC TGTGTGGCAC ACGGGGTCCC ACCACCTAGC 1140GTGAGCTGTG TGCGCTCTGG AAAGGAGGAA GTCATGGAAG GGCCCCTGCG TTTTGGCCGG 1200GAGCACGCTG GCACTTACCG ATGCGAAGCC ATCAACGCCA GGGGATCAGC GGCCAAAAAT 1260GTGGCTGTCA CGGTGGAATA TGGTCCCCGG AATTC1295(2)序列资料SEQ ID NO7(iv)序列特征(A)长度2214碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO7CGAATCTTGA GTGGGATGCG GGACTCCCGT GCTATTTCTT GGCGGAGGTC TTTCCTGGTC 60CTTATGGACA CCCCTGGTTT GGGATATGGG GGCCGCTAAG ATTTCAGAGA TGGGGTCCCT 120AGGCTGAGCC CGCGTTTTCC CGGGCAGCGG TCGCGCTAGA ACCTTTCTGG GCGGACCTTC 180AGCCCCGCGT GGCGCTCGTG GAGCGCGGGG GCTCGCTGTG GCTCAACTGC AGCACTAACT 240GTCCGAGGCC GGAGCGCGGT GGYCTGGAGA CCTCGCTACG CCGAAACGGG ACCCAGAGGG 300GTCTGCGCTG GCTGGCTCGA CAGMTGGTGG ACATCCGAGA GCCTGAAACC CAGTCGGTCT 360GCTTCTTCCG CTGGGCGCGC CGCACACTCC AAGNGAGTGG GCTCATCCGA ACTTTCCAGC 420GACCGGATCG GGTAGAGCTA GTGCCTCTGN CTCCTTGGCA GCCTGTAGGT GAGAACTTCA 480CCTTGAGCTG CAGGGTCCCG GGGGCAGGAC CCCGAGCGAG CCTCACATTG ACCTTGCTGC 540GAGGCGGCCA GGAGCTGATT CGCCGAAGTT TCGTAGGCGA GCCACCCCGA GCTCGGGGTG 600CGATGCTCAC CGCCACGGTC CTGGCGCGCA GAGAGGATCA CAGGGCCAAT TTCTCATGCC 660TCGCGGAGCT TGACCTGCGG ACACACGGCT TGGGACTGTT TGCAAACAGC TCAGCCCCCA 720GACAGCTCCG CACGTTTGGC ATGCCTCCAC TTTCCCCGAG CCTTATTGNC CCACGATTCT 780TAGAAGTGGG CTCAGAAAGG CCGGTGACTT GCACTTTGGA TGGACTGTTT CCTGCCCCAG 840AAGCCGGGGT TTACCTCTCT CTGGGAGATC AGAGGCTTCA TCCTAATGTG ACCCTCGACG 900GGGAGAGCCT TGTGGCCACT GNCACAGMTA CAGCAAGTGA AGAACAGGAA GGCACCAAAC 960AGCTGATGTG CATCGTGACC CTCGGGGGCG AAAGCAGGGA GACCCAGGAA AACCTGACTG 1020TCTACAGCTT CCCGGCTCCT CTTCTGACTT TAAGTGAGCC AGAAGCCCCC GAGGGAAAGA 1080TGGTGACCGT AAGCTGCTGG GCAGGGGCCC GAGCCCTTGT CACCTTGGAG GGAATTCCAG 1140CTGCGGTCCC TGGGCAGCCC GCTGAGCTCC AGTTAAATGT CACAAAGAAT GACGACAAGC 1200GGGGCTTCTT CTGCGACGCT GCCCTCGATG TGGACGGGGA AACTCTGAGA AAGAACCAGA 1260GCTCTGAGCT TCGTGTTCTG TACGCACCTC GGCTGGATGA CTTGGACTGT CCCAGGAGCT 1320GGACGTGGCC AGAGGGTCCA GAGCAGACCC TCCACTGCGA GGCCCGTGGA AACCCTGAGC 1380CCTCCGTGCA CTGTGCAAGG CCTGACGGTG GGGCGGTGCT AGCGCTGGGC CTGTTGGGTC 1440CAGTGACCCG TGCCCTCGCG GGAACTTACC GATGTACAGC AATCAATGGG CAAGGCCAGG 1500CGGTCAAGGA TGTGACCCTG ACTGTGGAAT ATGCCCCAGC GCTGGACAGT GTAGGCTGCC 1560CAGAACGTAT TACTTGGCTG GAGGGGACAG AGGCATCGCT TAGCTGTGTG GCACACGGGG 1620TCCCACCACC TAGCGTGAGC TGTGTGCGCT CTGGAAAGGA GGAAGTCATG GAAGGGCCCC 1680TGCGTGTGGC CCGGGAGCAC GCTGGCACTT ACCGATGCGA AGCCATCAAC GNCAGGGGAT 1740CAGCGGWCAA AAATGTGGCT GTCACGGTGG AATATGGTCC CAGTTTGGAG GAGTTGGGCT 1800GCCCCAGYAA CTGGACTTGG GTAGAAGGAT CTGGAAAACT GTTTTCCTGT GAAGTTGATG 1860GGAAGCCGGA ACCACGCGTG GAGTGCGTGG GCTCGGAGGG TGCAAGCGAA GGGGTAGTGT 1920TGCCCCTGGT GTCCTCGAAC TCTGGTTCCA GAAACTCTAT GACTCCTGGT AACCTGTCAC 1980CGGGTATTTA CCTCTGCAAC GCCACCAACC GGMATGGNTC CACAGTCAAA ACAGTCGTCG 2040TGAGCGCGGA ATCACCGCCA CAGATGGATG AATCCAGTTG CCCGAGTCAC CAGACATGGN 2100TGGAAGGAGC CGAGGNTACT GCGCTGGCCT GCAGTGCCAG AGGNCGCCCC TCTCCACGCG 2160TGCGCTGTTC CAGGGAAGGT GCAGMCAGGC TGGAGAGGNT ACAGGTGTCC CGAG 2214(2)序列资料 SEQ ID NO8(i)序列特征(A)长度5077碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO8CCGAACGCTC CTCGGCCTCT GGTCTNCTCT GGNCCTGGGG ATCCTAGGCA TCTCAGGTAA 60GAAGAGCCCG CCCGTGGAGC NAGGTGGATA AGGCGGGGGC GGAATTGAAG GACCAGAGAG 120GGCGGCCCGG GTGTCCCCCT CCAGGCTCCG CCCTCTTCTA GCTTCCCACG CTTCTGTCAC 180CACCTGGAGN TCGGGGCTTC TCCCCGTCCT TCCTCCACCC CAACACACCT CAATCTTTCA 240GANCTGAACC CAGCACCTTT TCTGGANTNG GGGNNTTGCA CCTAACCTGT CTCAGGAGAN 300ACTGTGGCTC TCCTGTCCTC TCCTGCTCTG TNATGCCCTA TGGTTCACAG ACTGGCATCA 360TCCCTATTCA TGATCCTCAA AGACNCCATC TCCTCAACTG TCATAACTCA GAGCTCTATT 420CCCCCTCCAC CTGGAGCCCT GGAAACCGGC TTTCTAGGGC TTTTCTCCGC GGTTCTTTCC 480CGGAGTTCAG CGTTGTGGCT TTTTGTCCAA GTTACTCAAG TTTGGGGACA ATCTCCTTTA 540AGCCTTTGAC TCAGTCTCAT TTCCACTTTG CTTTTGCCCC AAGCCTCTGT GTCTCTCCCC 600CATTTCCTGA CGATCTGTCA GAGTCTTAAG AGTGATTTGG TTCCCCATCC CCCCTCCAAC 660TGGAGTCTCC TCCTCACTAT TGATGTGTGC ATCTGAGACC CCCATCCCCG CACCGAGTTT 720CCCCATCTCT GTCAGTAAAG AGCAAGGCTT CCAGAGACAA CCCTCTAATA GCGCGTCAGT 780CCCGAATCTT GAGTGGGATG CGGGACTCCC GTGCTATTTC TTGGCGGAGG TCTTTCCTGG 840TCCTTATGGA CACCCCTGGT TTGGGATATG GGGGCCGCTA AGATTTCAGA GATGGGGTCC 900CTAGGCTGAG NCCGCGTTTT CCCGGGCAGC GGTCGCGCTA GAACCTTTCT GGGCGGACCT 960TCAGCCCCGC GTGGCGCTCG TGGAGCGCGG GGGCTCGCTG TGGCTCAACT GCAGCACTAA1020CTGTCCGAGG CCGGAGCGCG GTGGCCTGGA GACCTCGCTA CGCCGAAACG GGACCCAGAG1080GGGTCTGNAC TGNCTGGCTC GACAGCTGGT GGACATCCGA GANCCTGAAA CCCAGCCGGT1140CTGCTTCTTC CNCTGCGCGC GCCGCACACT CCAAGCGCGT GGGCTCATCC GAACTTTCCG1200TGAGTTCAGG GTGGGCACNC CCCTTGGGTC TCTGGACCTC CCCCTCAAGC TCCTCCCACC1260CGCCCTCTGA TCCTCCTGCT TGTTCTGAAA GTACTACAGC TGGCTAGAGC GGAGTTTTTG1320GTCCCTTGCA GAGCGACCGG ATCGGGTAGA GCTAGTGCCT CTGCCTCCTT GGCAGCCTGT1380AGGTGAGAAC TTCACCTTGA GCTGCAGGGT CCCGGGGGCA GGACCCCGAG CGAGCCTCAC1440ATTGACCTTG CTGCGAGGCG GCCAGGAGCT GATTCGCCGA AGTTTCGTAG GCGAGCCACC1500CCGAGCTCGG GGTGCGATGC TCACCGCCAC GGTCCTGGCG CGCAGAGAGG ATCACAGGGC1560CAATTTCTCA TGCCTCGCGG AGCTTGACCT GCGNCCACAC GGCTTGGGAC TGTTTGCANA1620CAGCTCAGCC CCCAGACAGC TCCGCACGTT TGGTGAGTGT GGACCCTAAC TGACAGATTT1680TAAGAAGTTT AGGGCAGCCA GGCGTGGTGG CATGGTGTCG TAGGCCCTAA GTCCCAGCCC1740AAGCAGANCT AAGNCGGATC TCTTGTGAAT TAAAAGTCTA GCTCGTCTAC ATAACGAGGN1800CTGCATAGTT AAATCCCCCA AAAGTCTAAG CAGCTAGCCC TTACTTCCAA CACAAGTACT1860AGCTTAAGTA CTTTCTCCTG TGAGCTTTTT CCTTTATGTA TTTACTCGTT GAGAGAAAAA1920GAGAGTGTGT GTACGTGCCT TTATGCACAT GCCGCAGTGC TTGTATGGAA GTTAAAGAAT1980AAGGAGGCGT TCTGCCCTTC CATCCTGTGG GTCCTAGGGG TGGTATTAGC TCCTCAGGCT2040TTGTTAGTNA CAAGCGCCTA GGCTTGGGGA GCCATCTCGC CCGCTCCTCT GTATCTTTAG2100GGTGAAACCA GACAATGCAT GCAAATTGGT TGATCAACAC TGAATGTTTA GTTCGTAAAT2160TCAAGCTCTG TTCTTTGTCT TCCTCAGCCA TGCCTCCACT TTCCCCCGAG CCTTATTGCC2220CCACGATTCT TAGAAGTGGG CTCAGAAAGG CCGGTGACKT GCACTTTGGA TGGACTGTTT2280CCTGCCCCAG AAGCCGGGGT TTACTTCTCT CTGGGAGATC AGAGGCTTCA TCCTAATGTG2340ACCCTCGACG GGGAGAGCCT TGTGGCCACT GCCACAGCTA CAGCAAGTGA AGAACAGGAA2400GGCACCAAAC AGCTGATGTG CATCGTGACC CTCGGGGGCG AAAGCAGGGA GACCCAGGAA2460AACCTGACTG TCTACAGTAA GGGGAATCCA ACAAGACCTT CAATAGCTCA GACTGGGGCT2520GGGGCTGGGT CTGGGTCTGG GGCCAGAGTC TCACAAAGGC GGAGCCTATA AAGTGGGCGG2580GACCTCCACA CCAGAACAAG CCGGGCGGGA GAGTTCCAGG GCAGGAGCAG ATAGAAGTTG2640GAAATTAATA GATTGGGTTG AGTTCCCTGA GTGGGGAGTG AACCCCACCC AATTCTCTGT2700CCCCAGGCTT CCCGGCTCCT CTTCTGACTT TAAGTGAGCC AGAAGCCCCC GAGGGAAAGA2760TGGTGACCGT AAGCTGCTGG GCAGGGGCCC GAGCCCTTGT CACCTTGGAG GGAATTCCAG2820CTGCGGTCCC TGGGCAGCCC GCTGAGCTCC AGTTAAATGT CACAAAGAAT GACGACAAGC2880GGGGCTTCTT CTGCGACGCT GCCCTCGATG TGGACGGGGA AACTCTGAGA AAGAACCAGA2940GCTCTGAGCT TCGTGTTCTG TGTGAGTGGA TGTTCACTTT ATCTCTGTGA ATTCCAAGGA3000CCCTCTTACC GGCCCCATCT TTAACCTTAT CGTATCCCCT CTGCCTCATG CCCGCAGACG3060CACCTCGGCT GGATGACTTG GACTGTCCCA GGAGCTGGAC GTGGCCAGAG GGTCCAGAGC3120AGACCCTCCA CTGCGAGGCC CGTGGAAACC CTGAGCCCTC CGTGCACTGT GCAAGGCCTG3180ACGGTGGGGC GGTGCTAGCG CTGGGCCTGT TGGGTCCAGT GACCCGTGCC CTCGCGGGCA3240CTTACCGATG TACAGCAATC AATGGGCAAG GCCAGGCGGT CAAGGATGTG ACCCTGACTG3300TGGAATGTGA GTAGGGGGAG GTGGGCATGC TTATCCCTTT AAGGTCACGG AGTGTACTGG3360GAGACTGGCT ATACGGAAAG GAAAGAAGCC TAGGTTCAGC AGGGATTGGG AAAACACTGA3420AGGAAAGTGG TGTGGTGTTT ACAAACTTAA CGGTGGTAAC TGGGCACGGT CTGGCAAAAA3480CAGACAGCCA AGAGAGTGTG CCTGGGAAGC TGCAATGGGG GCTTTGTGGG AATTGGTCAA3540CAGCACCCTG AGATCTCAGG AAAGGGGCCT GAAGTTATCT CCAGAACCCA TGTGAAGGCA3600GGAAGAGAGA ACGCCCACCT TTTCCTGCTC CCCCCAACCC CCCCCCACAT ATCACACGGA3660GTATATAAAT AAATAAAATG GCTCCTGCCG GAGGGAGTGA GAAGCTGTCT CCTGCAGGCT3720CAGAGCAGTG GTAGTGCATG CCTTTAATCC CAGCACTCGG TAGGCAAAGG CAGGCAGATC3780TCTGTGAATG TGGGGCCAGC CTGGTCTGTA CAGAGAAATC CTGTCTCAAA ACAAACCAGC3840AAAGAAACAA AACCAAAATC AATTCCAGAT GCCCCAGCGC TGGACAGTGT AGGCTGCCCA3900NGACGTATTA CTTGNCTGGA GGGGACAGAG GCATCGCTTA GCTGTGTGGC ACACGGGGTC3960CCACCACCTA GCGTGAGCTG TGTGCGCTCT GGAAAGGAGG AAGTCATGGA AGGGCCCCTG4020CGTGTGGCCC GGGAGCACGC TGGCACTTAC CGATGCGAAG CCATCAACGC CAGGGGATCA4080GCGGNCAAAA ATGTGGCTGT CACGGTGGAA TGTGAGTAGG GGTGGCTACG GAAATGTCCA4140CACCTGCGTC CTCTGTCCTC AGTGTGAACT CCTATTTCCC TGCTTCCTAG ATGGTCCCAG4200TTNTGAGGAG TTGGGCTGCC CCAGCAACTG GACTTGGGTA GAAGGATCTG GAAAACTGTT4260TTCCTGTGAA GTTGATGGGA AGCCGGAACC ACGCGTGGAG TGCGTGGGCT CGGAGGGTGC4320AAGCGAAGGG GTAGTGTTGC CCCTGGTGTC CTCGAACTCT GGTTCCAGAA ACTCTATGAC4380TCCTGGTAAC CTGTCACCGG GTATTTACCT CTGCAACGCC ACCAACCGGC ATGGCTCCAC4440AGTCAAAACA GTCGTCGTGA GCGCGGAATG TGAGCAGGGG CCCAGGTGGG CGGAGAGTAC4500CGGGTGTCCC AGGATCTTTT CTTTCCCTGA TGCCCCTCCT TATGGTGGCT GATCTGCAGC4560ACCGCCACAG ATGGATGAAT CCAGTTGCCC GAGTCACCAG ACATGGCTGG AAGGAGCCGA4620GGCTACTGCG CTGGCCTGCA GTGACAGGGG NCGCCCCTCT CCACGCGTGC GCTGTTCCAG4680GGAAGGTGCA GCCAGGCTGG AGAGGCTACA GGTGTCCCGA GAGGATGCGG GGACCTACCT4740GTGTGTGGCT ACCAACGCGC ATGGCACGGA TTCACGGACC GTCACTGTGG GTGTGGAATG4800TGAGTGAGGA CAGCGCTGAA TGAAGACGAC TCAGACCGCC AGAAAAGTGC CTTGAGGCCT4860GGGATGTATG ATCCAGTGGG TAGAGTGCTC AATTAGCACT CACTAAAATG TATATTCTAT4920TCCTAATACT CTTTAATTTT ANCCTTTGGG AGGCAGAGAC AGGCAGATCT CTGTTCCGGG4980ATAACCTGCT CTCTGTCTAG GACAGCTTGG TCTACAGAGG GGNTACAGGC CCCCCCTCCC5040AAGATTGNAT AGCAACCCTC TGGCTCCCTG TCTCTCT 5077(2)序列资料 SEQ ID NO9(i)序列特征(A)长度1472碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO9NGAATTCCGG CGGATCGGGT AGAGCTAGTG CCTCTGCCTC CTTGGCAGCC TGTAGGTGAG 60AACTTCACCT TGAGCTGCAG GGTCCCGGGG GCAGGACCCC GAGCGAGCCT CACATTGACC 120TTGCTGCGAG GCGGCCAGGA GCTGATTCGC CGAAGTTTCG TAGGCGAGCC ACCCCGAGCT 180CGGGGTGCGA TGCTCACCGC CACGGTCCTG GCGCGCAGAG AGGATCACAG GGCCAATTTC 240TCATGCCTCG CGGAGCTTGA CCTGCGGCCA CACGGCTTGG GACTGTTTGC AAACAGCTCA 300GCCCCCAGAC AGCTCCGCAC GTTTGCCATG CCTCCACTTT CCCCGAGCCT TATTGCCCCA 360CGATTCTTAG AAGTGGGCTC AGAAAGGCCG GTGACTTGCA CTTTGGATGG ACTGTTTCCT 420GCCCCAGAAG CCGGGGTTTA CCTCTCTCTG GGAGATCAGA GGCTTCATCC TAATGTGACC 480CTCGACGGGG AGAGCCTTGT GGCCACTGCC ACAGCTACAG CAAGTGAAGA ACAGGAAGGC 540ACCAAACAGC TGATGTGCAT CGTGACCCTC GGGGGCGAAA GCAGGGAGAC CCAGGAAAAC 600CTGACTGTCT ACAGCTTCCC GGCTCCTCTT CTGACTTTAA GTGAGCCAGA AGCCCCCGAG 660GGAAAGATGG TGACCGTAAG CTGCTGGGCA GGGGCCCGAG CCCTTGTCAC CTTGGAGGGA 720ATTCCAGCTG CGGTCCCTGG GCAGCCCGCT GAGCTCCAGT TAAATGTCAC AAAGAATGAC 780GACAAGCGGG GCTTCTTCTG CGACGCTGCC CTCGATGTGG ACGGGGAAAC TCTGAGAAAG 840AACCAGAGCT CTGAGCTTCG TGTTCTGTGT GAGTGGATGT TCACTTTATC TCTGTGAATT 900CCAAGGACCC TCTTACCGGC CCCATCTTTA ACCTTATCGT ATCCCCTCTG CCTCATGCCC 960GCAGACGCAC CTCGGCTGGA TGACTTGGAC TGTCCCAGGA GCTGGACGTG GCCAGAGGGT 1020CCAGAGCAGA CCCTCCACTG CGAGGCCCGT GGAAACCCTG AGCCCTCCGT GCACTGTGCA 1080AGGCCTGACG GTGGGGCGGT GCTAGCGCTG GGCCTGTTGG GTCCAGTGAC CCGTGCCCTC 1140GCGGGCACTT ACCGATGTAC AGCAATCAAT GGGCAAGGCC AGGCGGTCAA GGATGTGACC 1200CTGACTGTGG AATATGCCCC AGCGCTGGAC AGTGTAGGCT GCCCAGAACG TATTACTTGG 1260CTGGAGGGGA CAGAGGCATC GCTTAGCTGT GTGGCACACG GGGTCCCACC ACCTAGCGTG 1320AGCTGTGTGC GCTCTGGAAA GGAGGAAGTC ATGGAAGGGC CCCTGCGTTT TCGCCGGGAG 1380CACGCTGGCA CTTACCGATG CGAAGCCATC AACGCCAGGG GATCAGCGGC CAAAAATGTG 1440GCTGTCACGG TGGAATATGG TCCCCGGAAT TC 1472(2)序列资料SEQ ID NO10(i)序列特征(A)长度2550碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO10CCTCTGCCTC CTTGGCAGCC TGTAGGTGAG AACTTCACCT TGAGCTGCAG GGTCCCGGGG 60GCAGGACCCC GAGCGAGCCT CACATTGACC TTGCTGCGAG GCGGCCAGGA GCTGATTCGC 120CGAAGTTTCG TAGGCGAGCC ACCCCGAGCT CGGGGTGCGA TGCTCACCGC CACGGTCCTG 180GCGCGCAGAG AGGATCACAG GGCCAATTTC TCATGCCTCG CGGAGCTTGA CCTGCGGCCA 240CACGGCTTGG GACTGTTTGC AAACAGCTCA GCCCCCAGAC AGCTCCGCAC GTTTGCCATG 300CCTCCACTTT CCCCGAGCCT TATTGCCCCA CGATTCTTAG AAGTGGGCTC AGAAAGGCCG 360GTGACTTGCA CTTTGGATGG ACTGTTTCCT GCCCCAGAAG CCGGGGTTTA CCTCTCTCTG 420GGAGATCAGA GGCTTCATCC TAATGTGACC CTCGACGGGG AGAGCCTTGT GGCCACTGCC 480ACAGCTACAG CAAGTGAAGA ACAGGAAGGC ACCAAACAGC TGATGTGCAT CGTGACCCTC 540GGGGGCGAAA GCAGGGAGAC CCAGGAAAAC CTGACTGTCT ACAGCTTCCC GGCTCCTCTT 600CTGACTTTAA GTGAGCCAGA AGCCCCCGAG GGAAAGATGG TGACCGTAAG CTGCTGGGCA 660GGGGCCCGAG CCCTTGTCAC CTTGGAGGGA ATTCCAGCTG CGGTCCCTGG GCAGCCCGCT 720GAGCTCCAGT TAAATGTCAC AAAGAATGAC GACAAGCGGG GCTTCTTCTG CGACGCTGCC 780CTCGATGTGG ACGGGGAAAC TCTGAGAAAG AACCAGAGCT CTGAGCTTCG TGTTCTGTAC 840GCACCTCGGC TGGATGACTT GGACTGTCCC AGGAGCTGGA CGTGGCCAGA GGGTCCAGAG 900CAGACCCTCC ACTGCGAGGC CCGTGGAAAC CCTGAGCCCT CCGTGCACTG TGCAAGGCCT 960GACGGTGGGG CGGTGCTAGC GCTGGGCCTG TTGGGTCCAG TGACCCGTGC CCTCGCGGGC1020ACTTACCGAT GTACAGCAAT CAATGGGCAA GGCCAGGCGG TCAAGGATGT GACCCTGACT1080GTGGAATATG CCCCAGCGCT GGACAGTGTA GGCTGCCCAG AACGTATTAC TTGGCTGGAG1140GGGACAGAGG CATCGCTTAG CTGTGTGGCA CACGGGGTCC CACCACCTAG CGTGAGCTGT1200GTGCGCTCTG GAAAGGAGGA AGTCATGGAA GGGCCCCTGC GTGTGGCCCG GGAGCACGCT1260GGCACTTACC GATGCGAAGC CATCAACGCC AGGGGATCAG CGGCCAAAAA TGTGGCTGTC1320ACGGTGGAAT ATGGTCCCAG TTTTGAGGAG TTGGGCTGCC CCAGCAACTG GACTTGGGTA1380GAAGGATCTG GAAAACTGTT TTCCTGTGAA GTTGATGGGA AGCCGGAACC ACGCGTGGAG1440TGCGTGGGCT CGGAGGGTGC AAGCGAAGGG GTAGTGTTGC CCCTGGTGTC CTCGAACTCT1500GGTTCCAGAA ACTCTATGAC TCCTGGTAAC CTGTCACCGG GTATTTACCT CTGCAACGCC1560ACCAACCGGC ATGGCTCCAC AGTCAAAACA GTCGTCGTGA GCGCGGAATC ACCGCCACAG1620ATGGATGAAT CCAGTTGCCC GAGTCACCAG ACATGGCTGG AAGGAGCCGA GGCTACTGCG 1680CTGGCCTGCA GTGCCAGAGG CCGCCCCTCT CCACGCGTGC GCTGTTCCAG GGAAGGTGCA 1740GCCAGGCTGG AGAGGCTACA GGTGTCCCGA GAGGATGCGG GGACCTACCT GTGTGTGGCT 1800ACCAACGCGC ATGGCACGGA TTCACGGACC GTCACTGTGG GTGTGGAATA CCGGCCTGTG 1860GTGGCTGAGC TGGCAGCCTC GCCCCCAAGC GTGCGGCCTG GCGGAAACTT CACTCTGACC 1920TGCCGTGCAG AGGCCTGGCC TCCAGCCCAG ATCAGCTGGC GCGCGCCCCC GGGAGCTCTC 1980AACCTCGGTC TCTCCAGCAA CAACAGCACG CTGAGCGTGG CGGGTGCCAT GGGCAGCCAT 2040GGTGGCGAGT ATGAGTGCGC AGCCACCAAT GCGCATGGGC GCCACGCACG GCGCATCACG 2100GTGCGCGTGG CCGGTCCATG GCTGTGGGTC GCTGTGGGCG GTGCGGCAGG GGGCGCGGCG 2160CTGCTGGCCG CAGGGGCCGG CCTGGCCTTC TACGTGCAGT CCACCGCTTG CAAGAAGGGA 2220GAGTACAACG TCCAGGAGGC TGAGAGCTCA GGCGAGGCGG TGTGTCTCAA TGGCGCGGGC 2280GGGACACCGG GTGCAGAAGG CGGAGCAGAG ACCCCCGGCA CTGCCGAGTC ACCTGCAGAT 2340GGCGAGGTTT TCGCCATCCA GCTGACATCT TCCTGAGCCT GTATCCAGCT CCCCCAGGGG 2400CCTCGAAAGC ACAGGGGTGG ACGTATGTAT TGTTCACTCT CTATTTATTC AACTCCAGGG 2460GCGTCGTCCC CGTTTTCTAC CCATTCCCTT AATAAAGTTT TTATAGGAGA AAAAAAAAAA 2520AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 2550(2)序列资料SEQ ID NO11(i)序列特征(A)长度222碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO11AATTCGATCA CTCGCGCTCC CCTCGCCTTC TGCGCTCTCC CCTCCCTGGC AGCGGCGGCA 60ATGCCGGGGC CTTCACCAGG GCTGCGCCGA ACGCTCCTCG GCCTCTGGGC TGCCCTGGGC120CTGGGGATCC TAGGCATCTC AGCGGTCGCG CTAGAACCTT TCTGGGCGGA CCTTCAGCCC180CGCGTGGCGC TCGTGGAGCG CGGGGGCTCG CTGTGGCTCA AC 222(2)序列资料SEQ ID NO12(i)序列特征(A)长度292碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO12TGTGGAGCTG GCACCCCTGC CTCCTTGGCA GCCGGTGGGC CAGAACTTCA CCCTGCGCTG 60CCAAGTGGAG GGTGGGTCGC CCCGGACCAG CCTCACGGTG GTGCTGCTTC GCTGGGAGGA 120GGAGCTGAGC CGGCAGCCCG CAGTGGAGGA GCCAGCGGAG GTCACTGCCA CTGTGCTGGC 180CAGCAGAGAC GACCACGGAG CCCCTTTCTC ATGCCGCACA GAACTGGACA TGCAGCCCCA 240GGGGCTGGGA CTGTTCGTGA ACACCTCAGC CCCCCGCCAG CTCCGAACCT TT 292(2)SEQ ID NO13资料(I)序列特征(A)长度105氨基酸(B)类型氨基酸(C)链单链(D)拓扑结构线形(ii)分子类型蛋白质(xii)序列描述SEQ ID NO13Pro Asp Arg Val Glu Leu Val Pro Leu Pro Pro Trp Gln Pro Val Gly1 5 10 15Glu Ash Phe Thr Leu Ser Cys Arg Val Pro Gly Ala Gly Pro Arg Ala20 25 30Ser Leu Thr Leu Thr Leu Leu Arg Gly Gly Gln Glu Leu Ile Arg Arg35 40 45Ser Phe Val Gly Glu Pro Pro Arg Ala Arg Cys Ala Met Leu Thr Ala50 55 60Thr Val Leu Ala Arg Arg Glu Asp His Arg Asp Asn Phe Ser Cys Leu65 70 75 80Ala Glu Leu Asp Leu Arg Thr His Gly Leu Gly Leu Phe Ala Asn Ser85 90 95Ser Ala Pro Arg Gln Leu Arg Thr Phe100 105(2)序列资料SEQ ID NO14(i)序列特征(A)长度27碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO14GAACTCGAGG CCATGCCTCC ACTTTCC27(2)序列资料 SEQ ID NO15(i)序列特征(A)长度30碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO15CCATAAGCTT TATTCCACCG TGACAGCCAC30(2)序列资料 SEQ ID NO16(i)序列特征(A)长度18碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO16AACGTGCGGA GCTGTCTG 18(2)序列资料 SEQ ID NO17(i)序列特征(A)长度27碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO17ACGGAATTCG AAGCCATCAA CGCCAGG27(2)序列资料 SEQ ID NO18(i)序列特征(A)长度27碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO18CATGAATTCC GAATCTTGAG TGGGATG27(2)序列资料SEQ ID NO19(i)序列特征(A)长度27碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO19ATAGAATTCC TCGGGACACC TGTAGCC 27(2)序列资料SEQ ID NO20(i)序列特征(A)长度18碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO20CARGGTGACA AGGGCTCG 18(2)序列资料SEQ ID NO21(i)序列特征(A)长度27碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO21TATGAATTCA GTTGAGCCAC AGCGAGC 27(2)序列资料SEQ ID NO22(i)序列特征(A)长度24碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO22CCGGGTCCTA GAGGTGGACA CGCA 24(2)序列资料SEQ ID NO23(i)序列特征(A)长度24碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO23TGCAGTGTCT CCTGGCTCTG GTTC 24(2)序列资料SEQ ID NO24(i)序列特征(A)长度992碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO24GCGAAAACCG GGAGACCCGG GAGAACGTGA CCATCTACAG CTTCCCGGCA CCACTCCTGA60CCCTGAGCGA ACCCAGCGTC TCCGAGGGGC AGATGGTGAC AGTAACCTGC GCAGCTGGGG 120CCCAAGCTCT GGTCACACTG GAGGGAGTTC CAGCCGCGGT CCCGGGGCAG CCCGCCCAGC 180TTCAGCTAAA TGCCACCGAG AACGACGACA GACGCAGCTT CTTCTGCGAC GCCACCCTCG 240ATGTGGACGG GGAGACCCTG ATCAAGAACA GGAGCGCAGA GCTTCGTGTC CTATACGCTC 300CCCGGCTAGA CGATTCGGAC TGCCCCAGGA GTTGGACGTG GCCCGAGGGC CCAGAGCAGA 360CGCTGCGCTG CGAGGCCCGC GGGAACCCAG AACCCTCAGT GCACTGTGCG CGCTCCGACG 420GCGGGGCCGT GCTGGCTCTG GGCCTGCTGG GTCCAGTCAC TCGGGCGCTC TCAGGCACTT 480ACCGCTGCAA GGCGGCCAAT GATCAAGGCG AGGCGGTCAA GGACGTAACG CTAACGGTGG 540AGTACGCACC AGCGCTGGAC AGCGTGGGCT GCCCAGAACG CATTACTTGG CTGGAGGGAA 600CAGAAGCCTC GCTGAGCTGT GTGGCGCACG GGGTACCGCC GCCTGATGTG ATCTGCGTGC 660GCTCTGGAGA ACTCGGGGCC GTCATCGAGG GGCTGTTGCG TGTGGCCCGG GAGCATGCGG 720GCACTTACCG CTGCGAAGCC ACCAACCCTC GGGGCTCTGC GGCCAAAAAT GTGGCCGTCA 780CGGTGGAATA TGGCCCCAGG TTTGAGGAGC CGAGCTGCCC CAGCAATTGG ACATGGGTGG 840AAGGATCTGG GCGCCTGTTT TCCTGTGAGG TCGATGGGAA GCCACAGCCA AGCGTGAAGT 900GCGTGGGCTC CGGGGGCACC ACTGAGGGGG TGCTGCTGCC GCTGGCACCC CCAGACCCTA 960GTCCCAGAGC TCCCAGAATC CCTAGAGTCC TG 992(2)序列资料SEQ ID NO25(i)序列特征(A)长度2775碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO25GCAGCCTCGC GTGGCGTTCG TGGAGCGCGG GGGCTCGCTG TGGCTGAATT GCAGCACCAA60CTGCCCTCGG CCGGAGCGCG GTGGCCTGGA GACCTCGCTG CGCCGAAACG GGACCCAGAG 120GGGTTTGCGT TGGTTGGCGC GGCAGCTGGT GGACATTCGC GAGCCGGAGA CTCAGCCCGT 180CTGCTTCTTC CGCTGCGCGC GGCGCACACT ACAGGCGCGT GGGCTCATTC GCACTTTCCA 240GCGACCAGAT CGCGTAGAGC TGATGCCGCT GCCTCCCTGG CAGCCGGTGG GCGAGAACTT 300CACCCTGAGC TGTAGGGTCC CCGGCGCCGG GCCCCGTGCG AGCCTCACGC TGACCCTGCT 360GCGGGGCGCC CAGGAGCTGA TCCGCCGCAG CTTCGCCGGT GAACCACCCC GAGCGCGGGG 420CGCGGTGCTC ACAGCCACGG TACTGGCTCG GAGGGAGGAC CATGGAGCCA ATTTCTCGTG 480TCGCGCCGAG CTGGACCTGC GGCCGCACGG ACTGGGACTG TTTGAAAACA GCTCGGCCCC 540CAGAGAGCTC CGAACCTTCT CCCTGTCTCC GGATGCCCCG CGCCTCGCTG CTCCCCGGCT 600CTTGGAAGTT GGCTCGGAAA GGCCCGTGAG CTGCACTCTG GACGGACTGT TTCCAGCCTC 660AGAGGCCAGG GTCTACCTCG CACTGGGGGA CCAGAATCTG AGTCCTGATG TCACCCTCGA720AGGGGACGCA TTCGTGGCCA CTGCCACAGC CACAGCTAGC GCAGAGCAGG AGGGTGCCAG780GCAGCTGGTC TGCAACGTCA CCCTGGGGGG CGAAAACCGG GAGACCCGGG AGAACGTGAC840CATCTACAGC TTCCCGGCAC CACTCCTGAC CCTGAGCGAA CCCAGCGTCT CCGAGGGGCA900GATGGTGACA GTAACCTGCG CAGCTGGGGC CCAAGCTCTG GTCACACTGG AGGGAGTTCC960AGCCGCGGTC CCGGGGCAGC CCGCCCAGCT TCAGCTAAAT GCCACCGAGA ACGACGACAG 1020ACGCAGCTTC TTCTGCGACG CCACCCTCGA TGTGGACGGG GAGACCCTGA TCAAGAACAG 1080GAGCGCAGAG CTTCGTGTCC TATACGCTCC CCGGCTAGAC GATTCGGACT GCCCCAGGAG 1140TTGGACGTGG CCCGAGGGCC CAGAGCAGAC GCTGCGCTGC GAGGCCCGCG GGAACCCAGA 1200ACCCTCAGTG CACTGTGCGC GCTCCGACGG CGGGGCCGTG CTGGCTCTGG GCCTGCTGGG 1260TCCAGTCACT CGGGCGCTCT CAGGCACTTA CCGCTGCAAG GCGGCCAATG ATCAAGGCGA 1320GGCGGTCAAG GACGTAACGC TAACGGTGGA GTACGCACCA GCGCTGGACA GCGTGGGCTG 1380CCCAGAACGC ATTACTTGGC TGGAGGGAAC AGAAGCCTCG CTGAGCTGTG TGGCGCACGG 1440GGTACCGCCG CCTGATGTGA TCTGCGTGCG CTCTGGAGAA CTCGGGGCCG TCATCGAGGG 1500GCTGTTGCGT GTGGCCCGGG AGCATGCGGG CACTTACCGC TGCGAAGCCA CCAACCCTCG 1560GGGCTCTGCG GCCAAAAATG TGGCCGTCAC GGTGGAATAT GGCCCCAGGT TTGAGGAGCC 1620GAGCTGCCCC AGCAATTGGA CATGGGTGGA AGGATCTGGG CGCCTGTTTT CCTGTGAGGT 1680CGATGGGAAG CCACAGCCAA GCGTGAAGTG CGTGGGCTCC GGGGGCACCA CTGAGGGGGT 1740GCTGCTGCCG CTGGCACCCC CAGACCCTAG TCCCAGAGCT CCCAGAATCC CTAGAGTCCT 1800GGCACCCGGT ATCTACGTCT GCAACGCCAC CAACCGCCAC GGCTCCGTGG CCAAAACAGT 1860CGTCGTGAGC GCGGAGTCGC CACCGGAGAT GGATGAATCT ACCTGCCCAA GTCACCAGAC 1920GTGGCTGGAA GGGGCTGAGG CTTCCGCGCT GGCCTGCGCC GCCCGGGGTC GCCCTTCCCC 1980AGGAGTGCGC TGCTCTCGGG AAGGCATCCC ATGGCCTGAG CAGCAGCGCG TGTCCCGAGA 2040GGACGCGGGC ACTTACCACT GTGTGGCCAC CAATGCGCAT GGCACGGACT CCCGGACCGT 2100CACTGTGGGC GTGGAATACC GGCCAGTGGT GGCCGAACTT GCTGCCTCGC CCCCTGGAGG 2160CGTGCGCCCA GGAGGAAACT TCACGTTGAC CTGCCGCGCG GAGGCCTGGC CTCCAGCCCA 2220GATCAGCTGG CGCGCGCCCC CGAGGGCCCT CAACATCGGC CTGTCGAGCA ACAACAGCAC 2280ACTGAGCGTG GCAGGCGCCA TGGGAAGCCA CGGCGGCGAG TACGAGTGCG CACGCACCAA 2340CGCGCACGGG CGCCACGCGC GGCGCATCAC GGTGCGCGTG GCCGGTCCGT GGCTATGGGT 2400CGCCGTGGGC GGCGCGGCGG GGGGCGCGGC GCTGCTGGCC GCGGGGGCCG GCCTGGCCTT 2460CTACGTGCAG TCCACCGCCT GCAAGAAGGG CGAGTACAAC GTGCAGGAGG CCGAGAGCTC 2520AGGCGAGGCC GTGTGTCTGA ACGGAGCGGG CGGCGGCGCT GGCGGGGCGG CAGGCGCGGA2580GGGCGGACCC GAGGCGGCGG GGGGCGCGGC CGAGTCGCCG GCGGAGGGCG AGGTCTTCGC2640CATACAGCTG ACATCGGCGT GAGCCCGCTC CCCTCTCCGC GGGCCGGGAC GCCCCCCAGA2700CTCACACGGG GGCTTATTTA TTGCTTTATT TATTTACTTA TTCATTTATT TATGTATTCA2760ACTCCAAGGG AATTC 2775(2)序列资料SEQ ID NO26(i)序列特征(A)长度1557碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO26CGCGCTCTCC TCGCCTCCTG TGCTTTCCCC GCCGCGGCGA TGCCAGGGCC TTCGCCAGGG 60CTGCGCCGGG CGCTACTCGG CCTCTGGGCT GCTCTGGGCC TGGGGCTCTT CGGCCTCTCA120GCGGTCTCGC AGGAGCCCTT CTGGGCGGAC CTGCAGCCTC GCGTGGCGTT CGTGGAGCGC180GGGGGCTCGC TGTGGCTGAA TTGCAGCACC AACTGCCCTC GGCCGGAGCG CGGTGGCCTG240GAGACCTCGC TGCGCCGAAA CGGGACCCAG AGGGGTTTGC GTTGGTTGGC GCGGCAGCTG300GTGGACATTC GCGAGCCGGA GACTCAGCCC GTCTGCTTCT TCCGCTGCGC GCGGCGCACA360CTACAGGCGC GTGGGCTCAT TCGCACTTTC CAGCGACCAG ATCGCGTAGA GCTGATGCCG420CTGCCTCCCT GGCAGCCGGT GGGCGAGAAC TTCACCCTGA GCTGTAGGGT CCCCGGCGCC480GGGCCCCGTG CGAGCCTCAC GCTGACCCTG CTGCGGGGCG CCCAGGAGCT GATCCGCCGC540AGCTTCGCCG GTGAACCACC CCGAGCGCGG GGCGCGGTGC TCACAGCCAC GGTACTGGCT600CGGAGGGAGG ACCATGGAGC CAATTTCTCG TGTCGCGCCG AGCTGGACCT GCGGCCGCAC660GGACTGGGAC TGTTTGAAAA CAGCTCGGCC CCCAGAGAGC TCCGAACCTT CTCCCTGTCT720CCGGATGCCC CGCGCCTCGC TGCTCCCCGG CTCTTGGAAG TTGGCTCGGA AAGGCCCGTG780AGCTGCACTC TGGACGGACT GTTTCCAGCC TCAGAGGCCA GGGTCTACCT CGCACTGGGG840GACCAGAATC TGAGTCCTGA TGTCACCCTC GAAGGGGACG CATTCGTGGC CACTGCCACA900GCCACAGCTA GCGCAGAGCA GGAGGGTGCC AGGCAGCTGG TCTGCAACGT CACCCTGGGG960GGCGAAAACC GGGAGACCCG GGAGAACGTG ACCATCTACA GCTTCCCGGC ACCACTCCTG 1020ACCCTGAGCG AACCCAGCGT CTCCGAGGGG CAGATGGTGA CAGTAACCTG CGCAGCTGGG 1080GCCCAAGCTC TGGTCACACT GGAGGGAGTT CCAGCCGCGG TCCCGGGGCA GCCCGCCCAG 1140CTTCAGCTAA ATGCCACCGA GAACGACGAC AGACGCAGCT TCTTCTGCGA CGCCACCCTC 1200GATGTGGACG GGGAGACCCT GATCAAGAAC AGGAGCGCAG AGCTTCGTGT CCTATACGCT 1260CCCCGGCTAG ACGATTCGGA CTGCCCCAGG AGTTGGACGT GGCCCGAGGG CCCAGAGCAG 1320ACGCTGCGCT GCGAGGCCCG CGGGAACCCA GAACCCTCAG TGCACTGTGC GCGCTCCGAC 1380GGCGGGGCCG TGCTGGCTCT GGGCCTGCTG GGTCCAGTCA CTCGGGCGCT CTCAGGCACT 1440TACCGCTGCA AGGCGGCCAA TGATCAAGGC GAGGCGGTCA AGGACGTAAC GCTAACGGTG 1500GAGTACGCAC CAGCGCTGGA CAGCGTGGGC TGCCCAGAAC GCATTACTTG GCTGGAG 1557(2)序列资料SEQ ID NO27(i)序列特征(A)长度2927碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(ix)特性(A)名称/关键字CDS(B)位置40..2814(xi)序列描述SEQ ID NO27CGCGCTCTCC TCGCCTCCTG TGCTTTCCCC GCCGCGGCG ATG CCA GGG CCT TCG 54Met Pro Gly Pro Ser1 5CCA GGG CTG CGC CGG GCG CTA CTC GGC CTC TGG GCT GCT CTG GGC CTG 102Pro Gly Leu Arg Arg Ala Leu Leu Gly Leu Trp Ala Ala Leu Gly Leu10 15 20GGG CTC TTC GGC CTC TCA GCG GTC TCG CAG GAG CCC TTC TGG GCG GAC 150Gly Leu Phe Gly Leu Ser Ala Val Ser Gln Glu Pro Phe Trp Ala Asp25 30 35CTG CAG CCT CGC GTG GCG TTC GTG GAG CGC GGG GGC TCG CTG TGG CTG 198Leu Gln Pro Arg Val Ala Phe Val Glu Arg Gly Gly Ser Leu Trp Leu40 45 50AAT TGC AGC ACC AAC TGC CCT CGG CCG GAG CGC GGT GGC CTG GAG ACC 246Asn Cys Ser Thr Asn Cys Pro Arg Pro Glu Arg Gly Gly Leu Glu Thr55 60 65TCG CTG CGC CGA AAC GGG ACC CAG AGG GGT TTG CGT TGG TTG GCG CGG 294Ser Leu Arg Arg Asn Gly Thr Gln Arg Gly Leu Arg Trp Leu Ala Arg70 75 80 85CAG CTG GTG GAC ATT CGC GAG CCG GAG ACT CAG CCC GTC TGC TTC TTC 342Gln Leu Val Asp Ile Arg Glu Pro Glu Thr Gln Pro Val Cys Phe Phe90 95 100CGC TGC GCG CGG CGC ACA CTA CAG GCG CGT GGG CTC ATT CGC ACT TTC 390Arg Cys Ala Arg Arg Thr Leu Gln Ala Arg Gly Leu Ile Arg Thr Phe105 110 115CAG CGA CCA GAT CGC GTA GAG CTG ATG CCG CTG CCT CCC TGG CAG CCG 438Gln Arg Pro Asp Arg Val Glu Leu Met Pro Leu Pro Pro Trp Gln Pro120 125 130GTG GGC GAG AAC TTC ACC CTG AGC TGT AGG GTC CCC GGC GCC GGG CCC 486Val Gly Glu Asn Phe Thr Leu Ser Cys Arg Val Pro Gly Ala Gly Pro135 140 145CGT GCG AGC CTC ACG CTG ACC CTG CTG CGG GGC GCC CAG GAG CTG ATC 534Arg Ala Ser Leu Thr Leu Thr Leu Leu Arg Gly Ala Gln Glu Leu Ile150 155 160165CGC CGC AGC TTC GCC GGT GAA CCA CCC CGA GCG CGG GGC GCG GTG CTC 582Arg Arg Ser Phe Ala Gly Glu Pro Pro Arg Ala Arg Gly Ala Val Leu170 175 180ACA GCC ACG GTA CTG GCT CGG AGG GAG GAC CAT GGA GCC AAT TTC TCG 630Thr Ala Thr Val Leu Ala Arg Arg Glu Asp His Gly Ala Asn Phe Ser185 190 195TGT CGC GCC GAG CTG GAC CTG CGG CCG CAC GGA CTG GGA CTG TTT GAA 678Cys Arg Ala Glu Leu Asp Leu Arg Pro His Gly Leu Gly Leu Phe Glu200 205 210AAC AGC TCG GCC CCC AGA GAG CTC CGA ACC TTC TCC CTG TCT CCG GAT 726Asn Ser Ser Ala Pro Arg Glu Leu Arg Thr Phe Ser Leu Ser Pro Asp215 220 225GCC CCG CGC CTC GCT GCT CCC CGG CTC TTG GAA GTT GGC TCG GAA AGG 774Ala Pro Arg Leu Ala Ala Pro Arg Leu Leu Glu Val Gly Ser Glu Arg230 235 240 245CCC GTG AGC TGC ACT CTG GAC GGA CTG TTT CCA GCC TCA GAG GCC AGG 822Pro Val Ser Cys Thr Leu Asp Gly Leu Phe Pro Ala Ser Glu Ala Arg250 255 260GTC TAC CTC GCA CTG GGG GAC CAG AAT CTG AGT CCT GAT GTC ACC CTC 870Val Tyr Leu Ala Leu Gly Asp Gln Asn Leu Ser Pro Asp Val Thr Leu265 270 275GAA GGG GAC GCA TTC GTG GCC ACT GCC ACA GCC ACA GCT AGC GCA GAG 918Glu Gly Asp Ala Phe Val Ala Thr Ala Thr Ala Thr Ala Ser Ala Glu280 285 290CAG GAG GGT GCC AGG CAG CTG GTC TGC AAC GTC ACC CTG GGG GGC GAA 966Gln Glu Gly Ala Arg Gln Leu Val Cys Asn Val Thr Leu Gly Gly Glu295 300 305AAC CGG GAG ACC CGG GAG AAC GTG ACC ATC TAC AGC TTC CCG GCA CCA 1014Asn Arg Glu Thr Arg Glu Asn Val Thr Ile Tyr Ser Phe Pro Ala Pro310 315 320 325CTC CTG ACC CTG AGC GAA CCC AGC GTC TCC GAG GGG CAG ATG GTG ACA 1062Leu Leu Thr Leu Ser Glu Pro Ser Val Ser Glu Gly Gln Met Val Thr330 335 340GTA ACC TGC GCA GCT GGG GCC CAA GCT CTG GTC ACA CTG GAG GGA GTT 1110Val Thr Cys Ala Ala Gly Ala Gln Ala Leu Val Thr Leu Glu Gly Val345 350 355CCA GCC GCG GTC CCG GGG CAG CCC GCC CAG CTT CAG CTA AAT GCC ACC 1158Pro Ala Ala Val Pro Gly Gln Pro Ala Gln Leu Gln Leu Asn Ala Thr360 365 370GAG AAC GAC GAC AGA CGC AGC TTC TTC TGC GAC GCC ACC CTC GAT GTG 1206Glu Asn Asp Asp Arg Arg Ser Phe Phe Cys Asp Ala Thr Leu Asp Val375 380 385GAC GGG GAG ACC CTG ATC AAG AAC AGG AGC GCA GAG CTT CGT GTC CTA 1254Asp Gly Glu Thr Leu Ile Lys Asn Arg Ser Ala Glu Leu Arg Val Leu390 395 400 405TAC GCT CCC CGG CTA GAC GAT TCG GAC TGC CCC AGG AGT TGG ACG TGG 1302Tyr Ala Pro Arg Leu Asp Asp Ser Asp Cys Pro Arg Ser Trp Thr Trp410 415 420CCC GAG GGC CCA GAG CAG ACG CTG CGC TGC GAG GCC CGC GGG AAC CCA 1350Pro Glu Gly Pro Glu Gln Thr Leu Arg Cys Glu Ala Arg Gly Asn Pro425 430 435GAA CCC TCA GTG CAC TGT GCG CGC TCC GAC GGC GGG GCC GTG CTG GCT 1398Glu Pro Ser Val His Cys Ala Arg Ser Asp Gly Gly Ala Val Leu Ala440 445 450CTG GGC CTG CTG GGT CCA GTC ACT CGG GCG CTC TCA GGC ACT TAC CGC 1446Leu Gly Leu Leu Gly Pro Val Thr Arg Ala Leu Ser Gly Thr Tyr Arg455 460 465TGC AAG GCG GCC AAT GAT CAA GGC GAG GCG GTC AAG GAC GTA ACG CTA 1494Cys Lys Ala Ala Asn Asp Gln Gly Glu Ala Val Lys Asp Val Thr Leu470 475 480 485ACG GTG GAG TAC GCA CCA GCG CTG GAC AGC GTG GGC TGC CCA GAA CGC 1542Thr Val Glu Tyr Ala Pro Ala Leu Asp Ser Val Gly Cys Pro Glu Arg490 495 500ATT ACT TGG CTG GAG GGA ACA GAA GCC TCG CTG AGC TGT GTG GCG CAC 1590Ile Thr Trp Leu Glu Gly Thr Glu Ala Ser Leu Ser Cys Val Ala His505 510 515GGG GTA CCG CCG CCT GAT GTG ATC TGC GTG CGC TCT GGA GAA CTC GGG 1638Gly Val Pro Pro Pro Asp Val Ile Cys Val Arg Ser Gly Glu Leu Gly520 525 530GCC GTC ATC GAG GGG CTG TTG CGT GTG GCC CGG GAG CAT GCG GGC ACT 1686Ala Val Ile Glu Gly Leu Leu Arg Val Ala Arg Glu His Ala Gly Thr535 540 545TAC CGC TGC GAA GCC ACC AAC CCT CGG GGC TCT GCG GCC AAA AAT GTG 1734Tyr Arg Cys Glu Ala Thr Asn Pro Arg Gly Ser Ala Ala Lys Asn Val550 555 560 565GCC GTC ACG GTG GAA TAT GGC CCC AGG TTT GAG GAG CCG AGC TGC CCC 1782Ala Val Thr Val Glu Tyr Gly Pro Arg Phe Glu Glu Pro Ser Cys Pro570 575 580AGC AAT TGG ACA TGG GTG GAA GGA TCT GGG CGC CTG TTT TCC TGT GAG 1830Ser Asn Trp Thr Trp Val Glu Gly Ser Gly Arg Leu Phe Ser Cys Glu585 590 595GTC GAT GGG AAG CCA CAG CCA AGC GTG AAG TGC GTG GGC TCC GGG GGC 1878Val Asp Gly Lys Pro Gln Pro Ser Val Lys Cys Val Gly Ser Gly Gly600 605 610ACC ACT GAG GGG GTG CTG CTG CCG CTG GCA CCC CCA GAC CCT AGT CCC 1926Thr Thr Glu Gly Val Leu Leu Pro Leu Ala Pro Pro Asp Pro Ser Pro615 620 625AGA GCT CCC AGA ATC CCT AGA GTC CTG GCA CCC GGT ATC TAC GTC TGC 1974Arg Ala Pro Arg Ile Pro Arg Val Leu Ala Pro Gly Ile Tyr Val Cys630 635 640 645AAC GCC ACC AAC CGC CAC GGC TCC GTG GCC AAA ACA GTC GTC GTG AGC 2022Asn Ala Thr Asn Arg His Gly Ser Val Ala Lys Thr Val Val Val Ser650 655 660GCG GAG TCG CCA CCG GAG ATG GAT GAA TCT ACC TGC CCA AGT CAC CAG 2070Ala Glu Ser Pro Pro Glu Met Asp Glu Ser Thr Cys Pro Ser His Gln665 670675ACG TGG CTG GAA GGG GCT GAG GCT TCC GCG CTG GCC TGC GCC GCC CGG 2118Thr Trp Leu Glu Gly Ala Glu Ala Ser Ala Leu Ala Cys Ala Ala Arg680 685 690GGT CGC CCT TCC CCA GGA GTG CGC TGC TCT CGG GAA GGC ATC CCA TGG 2166Gly Arg Pro Ser Pro Gly Val Arg Cys Ser Arg Glu Gly Ile Pro Trp695 700 705CCT GAG CAG CAG CGC GTG TCC CGA GAG GAC GCG GGC ACT TAC CAC TGT 2214Pro Glu Gln Gln Arg Val Ser Arg Glu Asp Ala Gly Thr Tyr His Cys710 715 720 725GTG GCC ACC AAT GCG CAT GGC ACG GAC TCC CGG ACC GTC ACT GTG GGC 2262Val Ala Thr Asn Ala His Gly Thr Asp Ser Arg Thr Val Thr Val Gly730 735 740GTG GAA TAC CGG CCA GTG GTG GCC GAA CTT GCT GCC TCG CCC CCT GGA 2310Val Glu Tyr Arg Pro Val Val Ala Glu Leu Ala Ala Ser Pro Pro Gly745 750 755GGC GTG CGC CCA GGA GGA AAC TTC ACG TTG ACC TGC CGC GCG GAG GCC 2358Gly Val Arg Pro Gly Gly Asn Phs Thr Leu Thr Cys Arg Ala Glu Ala760 765 770TGG CCT CCA GCC CAG ATC AGC TGG CGC GCG CCC CCG AGG GCC CTC AAC 2406Trp Pro Pro Ala Gln Ile Ser Trp Arg Ala Pro Pro Arg Ala Leu Asn775 780 785ATC GGC CTG TCG AGC AAC AAC AGC ACA CTG AGC GTG GCA GGC GCC ATG 2454Ile Gly Leu Ser Ser Asn Asn Ser Thr Leu Ser Val Ala Gly Ala Met790 795 800 805GGA AGC CAC GGC GGC GAG TAC GAG TGC GCA CGC ACC AAC GCG CAC GGG 2502Gly Ser His Gly Gly Glu Tyr Glu Cys Ala Arg Thr Asn Ala His Gly810 815 820CGC CAC GCG CGG CGC ATC ACG GTG CGC GTG GCC GGT CCG TGG CTA TGG 2550Arg His Ala Arg Arg Ile Thr Val Arg Val Ala Gly Pro Trp Leu Trp825 830 835GTC GCC GTG GGC GGC GCG GCG GGG GGC GCG GCG CTG CTG GCC GCG GGG 2598Val Ala Val Gly Gly Ala Ala Gly Gly Ala Ala Leu Leu Ala Ala Gly840 845 850GCC GGC CTG GCC TTC TAC GTG CAG TCC ACC GCC TGC AAG AAG GGC GAG 2646Ala Gly Leu Ala Phe Tyr Val Gln Ser Thr Ala Cys Lys Lys Gly Glu855 860 865TAC AAC GTG CAG GAG GCC GAG AGC TCA GGC GAG GCC GTG TGT CTG AAC 2694Tyr Asn Val Gln Glu Ala Glu Ser Ser Gly Glu Ala Val Cys Leu Asn870 875 880 885GGA GCG GGC GGC GGC GCT GGC GGG GCG GCA GGC GCG GAG GGC GGA CCC 2742Gly Ala Gly Gly Gly Ala Gly Gly Ala Ala Gly Ala Glu Gly Gly Pro890 895 900GAG GCG GCG GGG GGC GCG GCC GAG TCG CCG GCG GAG GGC GAG GTC TTC 2790Glu Ala Ala Gly Gly Ala Ala Glu Ser Pro Ala Glu Gly Glu Val Phe905 910 915GCC ATA CAG CTG ACA TCG GCG TGAGCCCGCT CCCCTCTCCG CGGGCCGGGA 2841Ala Ile Gln Leu Thr Ser Ala920 925CGCCCCCCAG ACTCACACGG GGGCTTATTT ATTGCTTTAT TTATTTACTT ATTCATTTAT2901TTATGTATTC AACTCCAAGG GAATTC 2927(2)序列资料SEQ ID NO28(i)序列特征(A)长度924氨基酸(B)类型氨基酸(C)链单链(D)拓扑结构线形(ii)分子类型蛋白质(xi)序列描述SEQ ID NO28Met Pro Gly Pro Ser Pro Gly Leu Arg Arg Ala Leu Leu Gly Leu Trp1 5 10 15Ala Ala Leu Gly Leu Gly Leu Phe Gly Leu Ser Ala Val Ser Gln Glu20 25 30Pro Phe Trp Ala Asp Leu Gln Pro Arg Val Ala Phe Val Glu Arg Gly35 40 45Gly Ser Leu Trp Leu Asn Cys Ser Thr Asn Cys Pro Arg Pro Glu Arg50 55 60Gly Gly Leu Glu Thr Ser Leu Arg Arg Asn Gly Thr Gln Arg Gly Leu65 70 75 80Arg Trp Leu Ala Arg Gln Leu Val Asp Ile Arg Glu Pro Glu Thr Gln85 90 95Pro Val Cys Phe Phe Arg Cys Ala Arg Arg Thr Leu Gln Ala Arg Gly100 105 110Leu Ile Arg Thr Phe Gln Arg Pro Asp Arg Val Glu Leu Met Pro Leu115 120 125Pro Pro Trp Gln Pro Val Gly Glu Asn Phe Thr Leu Ser Cys Arg Val130 135 140Pro Gly Ala Gly Pro Arg Ala Ser Leu Thr Leu Thr Leu Leu Arg Gly145 150 155 160Ala Gln Glu Leu Ile Arg Arg Ser Phe Ala Gly Glu Pro Pro Arg Ala165170 175Arg Gly Ala Val Leu Thr Ala Thr Val Leu Ala Arg Arg Glu Asp His180 185 190Gly Ala Asn Phe Ser Cys Arg Ala Glu Leu Asp Leu Arg Pro His Gly195 200 205Leu Gly Leu Phe Glu Asn Ser Ser Ala Pro Arg Glu Leu Arg Thr Phe210 215 220Ser Leu Ser Pro Asp Ala Pro Arg Leu Ala Ala Pro Arg Leu Leu Glu225 230 235 240Val Gly Ser Glu Arg Pro Val Ser Cys Thr Leu Asp Gly Leu Phe Pro245 250255Ala Ser Glu Ala Arg Val Tyr Leu Ala Leu Gly Asp Gln Asn Leu Ser260 265 270Pro Asp Val Thr Leu Glu Gly Asp Ala Phe Val Aia Thr Ala Thr Ala275 280 285Thr Ala Ser Ala Glu Gln Glu Gly Ala Arg Gln Leu Val Cys Asn Val290 295 300Thr Leu Gly Gly Glu Asn Arg Glu Thr Arg Glu Asn Val Thr Ile Tyr305 310 315 320Ser Phe Pro Ala Pro Leu Leu Thr Leu Ser Glu Pro Ser Val Ser Glu325 330 335Gly Gln Met Val Thr Val Thr Cys Ala Ala Gly Ala Gln Ala Leu Val340 345 350Thr Leu Glu Gly Val Pro Ala Ala Val Pro Gly Gln Pro Ala Gln Leu355 360 365Gln Leu Asn Ala Thr Glu Asn Asp Asp Arg Arg Ser Phe Phe Cys Asp370 375 380Ala Thr Leu Asp Val Asp Gly Glu Thr Leu Ile Lys Asn Arg Ser Ala385 390 395 400Glu Leu Arg Val Leu Tyr Ala Pro Arg Leu Asp Asp Ser Asp Cys Pro405 410 415Arg Ser Trp Thr Trp Pro Glu Gly Pro Glu Gln Thr Leu Arg Cys Glu420 425 430Ala Arg Gly Asn Pro Glu Pro Ser Val His Cys Ala Arg Ser Asp Gly435 440 445Gly Ala Val Leu Ala Leu Gly Leu Leu Gly Pro Val Thr Arg Ala Leu450 455 460Ser Gly Thr Tyr Arg Cys Lys Ala Ala Asn Asp Gln Gly Glu Ala Val465 470 475 480Lys Asp Val Thr Leu Thr Val Glu Tyr Ala Pro Ala Leu Asp Ser Val485 490 495Gly Cys Pro Glu Arg Ile Thr Trp Leu Glu Gly Thr Glu Ala Ser Leu500 505 510Ser Cys Val Ala His Gly Val Pro Pro Pro Asp Val Ile Cys Val Arg515 520 525Ser Gly Glu Leu Gly Ala Val Ile Glu Gly Leu Leu Arg Val Ala Arg530 535 540Glu His Ala Gly Thr Tyr Arg Cys Glu Ala Thr Asn Pro Arg Gly Ser545 550 555 560Ala Ala Lys Asn Val Ala Val Thr Val Glu Tyr Gly Pro Arg Phe Glu565 570575Glu Pro Ser Cys Pro Ser Asn Trp Thr Trp Val Glu Gly Ser Gly Arg580 585 590Leu Phe Ser Cys Glu Val Asp Gly Lys Pro Gln Pro Ser Val Lys Cys595 600 605Val Gly Ser Gly Gly Thr Thr Glu Gly Val Leu Leu Pro Leu Ala Pro610 615 620Pro Asp Pro Ser Pro Arg Ala Pro Arg Ile Pro Arg Val Leu Ala Pro625 630 635 640Gly Ile Tyr Val Cys Asn Ala Thr Asn Arg His Gly Ser Val Ala Lys645 650 655Thr Val Val Val Ser Ala Glu Ser Pro Pro Glu Met Asp Glu Ser Thr660 665 670Cys Pro Ser His Gln Thr Trp Leu Glu Gly Ala Glu Ala Ser Ala Leu675 680 685Ala Cys Ala Ala Arg Gly Arg Pro Ser Pro Gly Val Arg Cys Ser Arg690 695 700Glu Gly Ile Pro Trp Pro Glu Gln Gln Arg Val Ser Arg Glu Asp Ala705 710 715 720Gly Thr Tyr His Cys Val Ala Thr Asn Ala His Gly Thr Asp Ser Arg725 730 735Thr Val Thr Val Gly Val Glu Tyr Arg Pro Val Val Ala Glu Leu Ala740 745 750Ala Ser Pro Pro Gly Gly Val Arg Pro Gly Gly Asn Phe Thr Leu Thr755 760 765Cys Arg Ala Glu Ala Trp Pro Pro Ala Gln Ile Ser Trp Arg Ala Pro770 775 780Pro Arg Ala Leu Asn Ile Gly Leu Ser Ser Asn Asn Ser Thr Leu Ser785 790 795 800Val Ala Gly Ala Met Gly Ser His Gly Gly Glu Tyr Glu Cys Ala Arg805 810 815Thr Asn Ala His Gly Arg His Ala Arg Arg Ile Thr Val Arg Val Ala820 825 830Gly Pro Trp Leu Trp Val Ala Val Gly Gly Ala Ala Gly Gly Ala Ala835 840 845Leu Leu Ala Ala Gly Ala Gly Leu Ala Phe Tyr Val Gln Ser Thr Ala850 855 860Cys Lys Lys Gly Glu Tyr Asn Val Gln Glu Ala Glu Ser Ser Gly Glu865 870 875 880Ala Val Cys Leu Asn Gly Ala Gly Gly Gly Ala Gly Gly Ala Ala Gly885 890 895Ala Glu Gly Gly Pro Glu Ala Ala Gly Gly Ala Ala Glu Ser Pro Ala900 905 910Glu Gly Glu Val Phe Ala Ile Gln Leu Thr Ser Ala915 920(2)序列资料SEQ ID NO29(i)序列特征(A)长度65碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(xi)序列描述SEQ ID NO29GTACTTACAG GATCCGCGGT CTCGCAGGAG CCCTTCTGGG CGGACCTACA GCCTGCGTGG60CGTTC65(2)序列资料SEQ ID NO30(i)序列特征(A)长度31碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(xi)序列描述SEQ ID NO30ATTTCTCTCG AGGATGGTCA CGTTCTCCCG G 31(2)序列资料SEQ ID NO31(i)序列特征(A)长度33碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型cDNA(xi)序列描述SEQ ID NO31ATTTCTGGAT CCTACAGCTT CCCGGCACCA CTC33(2)序列资料SEQ ID NO32(i)序列特征(A)长度32碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(xi)序列描述SEQ ID NO32ATTTCTCTCG AGTTCCACGC CCACAGTGAC GG32(2)序列资料SEQ ID NO33(i)序列特征(A)长度1687碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO33GGATCCTTTG AGCCCTGAAA GTCGAGGTTG CAGTGAGCCT TGATCGTGCC ACTGCACTCC 60AGCCTGGGGG ACAGAGCACG ACCCTGTCTC CAAAAATAAA ATAAAAATAA AAATAAATAT 120TGGCGGGGGA ACCCTCTGGA ATCAATAAAG GCTTCCTTAA CCAGCCTCTG TCCTGTGACC 180TAAGGGTCCG CATTACTGCC CTTCTTCGGA GGAACTGGTT TGTTTTTGTT GTTGTTGTTG 240TTTTTGCGAT CACTTTCTCC AAGTTCCTTG TCTCCCTGAG GGCACCTGAG GTTTCCTCAC 300TCAGGGCCCA CCTGGGGTCC CGAAGCCCCA GACTCTGTGT ATCCCCAGCG GGTGTCACAG 360AAACCTCTCC TTCTGCTGGC CTTATCGAGT GGGATCAGCG CGGCCGGGGA GAGCCACGGG 420CAGGGGCGGG GTGGGGTTCA TGGTATGGCT TTCCTGATTG GCGCCGCCGC CACCACGCGG 480CAGCTCTGAT TGGATGTTAA GTTTCCTATC CCAGCCCCAC CTTCAGACCC TGTGCTTTCC 540TGGAGGCCAA ACAACTGTGG AGCGAGAACT CATCTCCAAA ATAACTTACC ACGCTGGAGT 600GAGACCACGA ATGGTGGGGA GGGGAGGGTC CCACGGACAT ATTGAGGGAC GTGGATACGC 660AGAAGAGGTA TCCATGTGGT GGCAGCCGGG AAGGGGTGAT CAGATGGTCC ACAGGGAATA 720TCACAAACTC GAATTCTGAC GATGTTCTGG TAGTCACCCA GCCAGATGAG CGCATGGAGT 780TGGCGGTGGG GGGTGTCAAA GCTTGGGGCC CGGAAGCGGA GTCAAAAGCA TCACCCTCGG 840TCCCTTGTTC TCGCGTGGAT GTCAGGGCCT CCACCCACCG AGCAGAAGGC GGACTCAGGG 900GCGCTCCAGG GTGGCTCGAG CTCACACACG CTGAGTAGAC ACGTGCCCGC TGCACCCTGG 960GTAAATACAG ACCCGGAGCC GAGCGGATTC TAATTTAGAC GCCCGCGAAC GCTGCGCGCA1020CGCACACGTG TCCTCGGCTC GCTGGCACTT TCGTCCCGCC CCCTCCGTCG CGTGCCGGAG1080CTGACCCGGA GGGGTGCTTA GAGGTATGGC TCCGCGGGGT CAAAAGGAGA AGGATCAGTG 1140AGAGAGGATC CCCACACCCT CCCCTAGAAC TGTCCTTTCC CCATCCAGTG CCTCCCAAAT 1200CTCTCTTAGT CCCCAAATGT ATCCCCGCCC TAAGGGGCGC TGGTGGGAGG AGCTAAATGT 1260GGGGGCGGAG CTCGGAGTCC AGCTTATTAT CATGGCATCT CAGCCAGGGC TGGGGTAGGG 1320GTTTGGGAAG GGCAACCCAG CATCCCCCGA TCCCAGAGTC GCGGCCGGGG ATGACGCGAG 1380AGAGCGTGGT CGCCCCCAGA AGGCCCTGGG CCATCATGCC GGCCTCCACG TAGACCCCAG 1440GGGTCGCTCA CTCCTGCCAG CTCGCCTTCA CCAAGGCCAG GAGCTTAGCG CACGCTCGCC 1500TCCCGCCCCC CCGCCGCCTC TGCCGCCGCC CCCTCCTTGG AAACCAAGTT ACCAACGTTA 1560AACCAATCCC CAAGCGCAAC TCTGTCTCCC CCACACCCCA CCCGCCGCGC CGCGCGGAGC 1620CGTCCTCTAG CCCAGCTCCT CGGCTCGCGC TCTCCTCGCC TCCTGTGCTT TCCCCGCCGC 1680GGCGATG 1687(2)序列资料SEQ ID NO34(i)序列特征(A)长度36碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(xi)序列描述SEQ ID NO34CAGAACTCCG CTTACAGGAG GCGAGGAGAG CGCGAG 36(2)序列资料SEQ ID NO35(i)序列特征(A)长度31碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(xi)序列描述SEQ ID NO35CAACAATGCT AGCCAAGCGC AACTCTGTCT C31(2)序列资料SEQ ID NO36(i)序列特征(A)长度31碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(xi)序列描述SEQ ID NO36CAACAATGCT AGCCTTGGAA ACCAAGTTAC C31(2)序列资料SEQ ID NO37(i)序列特征(A)长度33碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(xi)序列描述SEQ ID NO37CAACAATGCT AGCAGGCGCT TAGCGCACGC TCG 33(2)序列资料SEQ ID NO38(i)序列特征(A)长度32碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(xi)序列描述SEQ ID NO38CAACAATGCT AGCCATGCCG GCCTCCACGT AG 32(2)序列资料SEQ ID NO39(i)序列特征
(A)长度31碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(xi)序列描述SEQ ID NO39CAACAATGCT AGCGTCCAGC TTATTATCAT G31(2)序列资料SEQ ID NO40(i)序列特征(A)长度32碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(xi)序列描述SEQ ID NO40CAACAATGCT AGCCTTAGTC CCCAAATGTA TC32(2)序列资料SEQ ID NO41(i)序列特征(A)长度30碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(xi)序列描述SEQ ID NO41CAACAATGCT AGCGGAGAAG GATCAGTGAG 30(2)序列资料SEQ ID NO42(i)序列特征
(A)长度33碱基对(B)类型核酸(C)链单链(D)拓扑结构线形(ii)分子类型DNA(xi)序列描述SEQ ID NO42CAACAATGCT AGCCTCCACC CACCGAGCAG AAG3权利要求
1.在一个个体中进行神经病理学筛查的方法,包括步骤a)从所述个体获得流体样品;b)用对ICAM-4有特异性免疫活性的抗体接触所述样品;c)定量检测所述样品中结合的ICAM-4/抗体水平;d)将在所述样品中结合的ICAM-4/抗体水平与已知无神经病理学的个体中结合的ICAM-4/抗体水平比较。
2.权利要求1的方法,其中所述流体样品是血清。
3.权利要求1的方法,其中所述流体样品是血浆。
4.权利要求1的方法,其中所述流体样品是脑脊液。
5.权利要求1的方法,其中所述结合的ICAM-4/抗体通过放射免疫测定(RIA)进行定量。
6.权利要求1的方法,其中所述结合的ICAM-4/抗体通过酶联免疫吸附测定(ELISA)进行定量。
7.权利要求1到6任何之一的方法,其中神经病理学是癫痫。
8.权利要求1到6任何之一的方法,其中神经病理学是爱滋病进程相关的痴呆。
9.权利要求1到6任何之一的方法,其中神经病理学是Alzheimer病。
10.权利要求1到6任何之一的方法,其中神经病理学是脑皮层痴呆。
11.权利要求10的方法,其中皮层痴呆选自Pick病,扩散性皮层Lewy体病,和额叶退化病。
12.权利要求1到6任何之一的方法,其中神经病理学是皮层下痴呆。
13.权利要求12的方法,其中皮层下痴呆选自Parkison病,Huntington病和进行性核上病(progressive supranuclear)。
14.权利要求1到6任何之一的方法,其中神经病理学是原发精神病学失调。
15.权利要求14的方法,其中原发精神病学失调选自抑郁,精神分裂症和精神病。
16.权利要求1到6任何之一的方法,其中神经病理学是非遗传性痴呆。
17.权利要求16的方法,其中非遗传性痴呆的起源条件包括感染,脉管炎,代谢失调,营养失调,血管失调,中毒性脑病理学病症和肿瘤。
全文摘要
提供与各种神经退化性失调症相关的循环ICAM-4浓度的定量检测方法。
文档编号C07K14/47GK1246923SQ98802232
公开日2000年3月8日 申请日期1998年10月2日 优先权日1997年10月2日
发明者P·D·基尔甘弄, W·M·加尔拉丁 申请人:艾科斯有限公司