专利名称:胃癌相关的基因家族的制作方法
技术领域:
本发明一般涉及胃癌患者的胃组织中的基因表达相对于正常胃组织中的基因表达所发生的变化。本发明具体涉及与正常组织相比在晚期胃癌以及其它恶性肿瘤中进行差异表达的人类基因家族。
背景技术:
胃癌
在美国,每年诊断出大约24000个胃癌新病例。尽管近60年来,胃癌的发病率显著降低,但是胃癌仍然是一种起因不明的严重疾病。在相似的境况下,某些人就患上了胃癌而其它人则没有患上胃癌。
胃癌通常发生在年龄大于55岁的人群中并且男人的发病率是妇女发病率的两倍。这类癌症在美国并不普遍,但是在日本、韩国、拉丁美洲和东欧部分地区却很普遍,这些地区的人食用了较多的经干燥、酸渍、烟熏或盐渍保存的食物。相反,食用新鲜水果和蔬菜可以预防这种疾病。
胃癌可以发生在胃的任何部位并且会扩散到整个胃和/或其它器官。这种癌症还可以沿着胃壁生长从而扩散到食管或小肠中。如果这种癌透过胃壁生长则会蔓延到附近的淋巴结、肝脏、胰腺和结肠。胃癌甚至能够扩散得更远,甚至到卵巢、肺和远距离的淋巴结。当胃癌转移到身体的另一个部位时,这些肿瘤细胞与原发肿瘤中的那些肿瘤细胞属于同一类型。换句话说,肝脏中的转移性细胞仍然是胃癌细胞。扩散到卵巢并生长成一个或多个卵巢肿瘤的这种肿瘤细胞被称作Krukenberg肿瘤而且是由被转化的胃细胞而不是卵巢细胞组成。
由于胃癌的症状是非特异性的,因此在胃癌早期很难检测出这种癌症。症状包括消化不良、胃灼热、腹痛、恶心和呕吐,腹泻或便秘、食欲减退、虚弱和疲劳,以及便血或吐血。诊断通常借助X-光检测胃肠道上部和食道来进行,当患者喝下液体钡示踪剂后进行X-光片的拍摄。利用胃镜还可以对胃和食道进行内窥镜检测。如果发现异常组织,还可以通过胃镜进行活组织检查。如果结果表明活组织样品具有癌细胞,则对周围淋巴结进行活组织检查,通过CT扫描检测周围的器官如肝脏和胰腺来确定疾病的程度或阶段。胃癌的治疗方法与那些用于其它类型癌的方法相似切除受影响的器官(部分或整体胃切除术),还可以清除附近淋巴结、化疗、放射疗法和免疫疗法(刺激袭击癌细胞的免疫系统组分)(http//cancernet.nci.nih.gov/canceertype s.html)。由于早期胃癌基本没有症状,所以在该疾病没有发展到晚期前通常不作诊断,而晚期的治疗却没有效果。
胃癌中的分子变化
对与胃癌的发生和发展相关的胃细胞中的分子变化基本没有了解。因此,存在着对在基因表达水平发生的变化进行研究的需求,以及存在着对与胃癌发生和发展相关的新分子标记物进行鉴定的需求。而且,如果期望阻止或减缓胃癌发展的干预能够成功,需要建立准确评估这种疾病早期症状的方法。一种准确评估胃癌早期症状的方法是识别与疾病进展相关的独特标记(参见例如Kim等(2001),癌基因204568-4575)。同样,预防或终止胃癌发展的治疗方法的建立取决于对在胃内部引起癌变和癌生长的基因进行的识别。
本发明的公开
本发明基于对在晚期胃癌(AGC)和其它恶性肿瘤中的表达与在正常组织中的表达具有差异性的新基因家族的发现。本发明包括含有SEQ ID NO3,5,7,9,11,13,17或19的分离核酸分子;编码SEQ ID NO4,14或18的氨基酸序列的分离核酸分子;编码在胃癌中被表达的蛋白并与SEQ ID NO3或17的全长序列具有至少约92%核苷酸序列相同性的分离核酸分子;编码在胃癌中被表达的蛋白并与SEQ ID NO13的全长序列具有至少约95%核苷酸序列相同性的分离核酸分子;和含有上述任一核酸分子的互补链的分离核酸分子。
本发明还包括与包括含所述分离核酸分子的载体在内的一种或多种表达控制元件可操作性连接的核酸分子。本发明还包括被转化而含有本发明的核酸分子的宿主细胞和用于生产蛋白的方法,该方法包括在该蛋白被表达的条件下培养经本发明核酸分子转化的宿主细胞的步骤。
本发明还提供了一种分离多肽,该多肽选自含SEQ ID NO4,6,8,10,12,14或18的氨基酸序列的分离多肽、含SEQ ID NO6,8,10或12的至少10个氨基酸的片段的分离多肽、含SEQ ID NO6,8,10或12的保守氨基酸取代物的分离多肽和含SEQ ID NO6,8,10或12的自然存在的氨基酸序列变异体的分离多肽。本发明的多肽还包括其氨基酸序列与SEQ ID NO4所示序列具有至少约90%、优选地至少约92-95%以及更优选地至少约95-98%氨基酸序列相同性的多肽。本发明的多肽还包括其氨基酸序列与SEQ ID NO6,8,10或12所示序列具有至少约50%、60%、70%或75%,优选地至少约80%,更优选地至少约90-95%以及最优选地至少约95-98%氨基酸序列相同性的多肽。本发明的多肽还包括其氨基酸序列分别与SEQ ID NO14和SEQ ID NO18所示序列具有至少约95%和至少约92%氨基酸序列相同性的多肽。
本发明还提供了一种与本发明的多肽发生特异性结合的分离抗体或抗原-结合型抗体片段,包括单克隆或多克隆抗体。
本发明还提供了鉴定调控编码本发明蛋白的核酸分子表达的介质(agent)的方法,该方法包括使表达所述核酸分子的细胞与所述介质接触;和确定所述介质是否调控所述核酸分子的表达,从而鉴定出调控编码所述蛋白的核酸分子的表达的介质。
本发明还提供了鉴定调控本发明蛋白的水平或至少一种活性的介质的方法,该方法包括使表达所述蛋白的细胞与所述介质接触;和确定所述介质是否调控所述蛋白的水平或至少一种活性,从而鉴定出调控所述蛋白的水平或至少一种活性的介质。
本发明还提供了鉴定本发明蛋白的结合配偶体的方法,该方法包括以下步骤使所述蛋白与可能的结合配偶体接触;和确定所述可能的配偶体是否与所述蛋白结合,从而鉴定出所述蛋白的结合配偶体。
本发明还提供了对编码本发明蛋白的核酸分子的表达进行调控的方法,该方法包括以下步骤施用有效量的调控编码所述蛋白的核酸分子的表达的介质。本发明还提供了调控本发明蛋白的至少一种活性的方法,该方法包括以下步骤施用有效量的调控本发明蛋白的至少一种活性的介质。
本发明还包括被改造而含有本发明的核酸分子的非-人类转基因动物或被改造而含有突变的核酸分子从而不能表达本发明的被编码的多肽的非-人类转基因动物。
本发明还包括非-人类转基因动物,其中含有SEQ ID NO3,5,7,9,11,13或17的全长或部分序列的完整或部分基因被从该动物的基因组中敲除或删除。
本发明还提供了诊断胃癌或恶性肿瘤的方法,该方法包括以下步骤从受试者身上获取组织、血液、尿液或其它样品,并确定本发明的核酸分子或本发明的多肽的表达水平。
本发明还包括含有稀释剂和多肽或蛋白的组合物,该多肽或蛋白选自含SEQ ID NO4,6,8,10,12,14或18的氨基酸序列的分离多肽、其氨基酸序列与SEQ ID NO4所示序列具有至少约90%、优选地至少约92-95%以及更优选地至少约95-98%氨基酸序列相同性的分离多肽、含SEQ ID NO6,8,10或12的至少10个氨基酸的片段的分离多肽、含SEQ ID NO6,8,10或12的保守氨基酸取代物的分离多肽、SEQ ID NO6,8,10或12的自然存在的氨基酸序列变异体、其氨基酸序列与SEQ ID NO6,8,10或12所示序列具有至少约50%、60%、70%或75%,优选地至少约80%,更优选地至少约90-95%以及最优选地至少约95-98%氨基酸序列相同性的分离多肽、其氨基酸序列与SEQ ID NO14所示序列具有至少约95%的分离多肽或其氨基酸序列与SEQ ID NO18所示序列具有至少约92%氨基酸序列相同性的分离多肽。
附图的简要描述
图1是显示SEQ ID NO1(克隆AD12)与SEQ ID NO3(克隆CH4)的序列差异的图表,其中SEQ ID NO1(克隆AD12)和SEQ ID NO3(克隆CH4)是被命名为LBFL301的基因的剪接变体。
图2是由LBFL301变体AD12的可读框编码的蛋白(SEQ ID NO2)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。
图3是由LBFL301变体CH4的可读框编码的蛋白(SEQ ID NO4)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。
图4是由LBFL304的可读框中的最长可读框编码的蛋白(SEQ IDNO6)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。
图5是由LBFL305的可读框编码的蛋白(SEQ ID NO14)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。
图6表示三个LBFL306克隆的相对比对位置。
图7是由克隆序号为LBFL306-EF3的可读框编码的蛋白(SEQ IDNO18)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。
图8是由克隆序号为LBFL306-GC7的可读框编码的蛋白(SEQ IDNO20)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。
图9是由克隆序号为LBFL306-GE2的可读框编码的蛋白(SEQ IDNO22)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。
实施本发明的最好方式
I.总述
本发明部分基于对新基因家族的鉴定,所述新基因家族在人的癌性胃组织和其它恶性肿瘤中的表达不同于在人正常组织中的表达。这些基因家族包括SEQ ID NOS1,3,5,7,9,11,1 3,17,19和21的人cDNA。
本发明的基因和蛋白可被用作检测样品中的胃癌或监视样品中的胃癌的发展的诊断试剂或标记物。它们还可以作为调控基因表达或活性的试剂的靶标。例如,可以鉴定调控与包括胃癌增生过程在内的肿瘤生长有关的生物学过程的介质。
II.具体的技术方案
A.与胃癌相关的蛋白质
本发明提供了分离的蛋白质、所述蛋白质的等位基因变体和所述蛋白质的保守氨基酸取代物。本文中所使用的“蛋白质”或“多肽”部分是指具有SEQ ID NO2,4,6,8,10,12,14或18所示的人氨基酸序列的蛋白质。该术语还指其氨基酸序列与以上具体列举的氨基酸序列略有差异的自然存在的等位基因变体和蛋白质。尽管等位基因变体具有的氨基酸序列与以上列举的氨基酸序列略有差异,但等位基因变体却仍然具有与这些蛋白质相同或相似的生物学功能。
本文中的与SEQ ID N02,4,6,8,10,12,14或18所示的人氨基酸序列相关的蛋白质家族包括从除人以外的生物体中分离的蛋白质。被用于鉴定和分离与这些蛋白质相关的蛋白质家族的其它成员的方法如以下所述。
本发明的蛋白质优选地是分离形式的。当采用物理、机械或化学方法从通常与蛋白质结合的细胞组分中移出所述蛋白质时该蛋白质就被认为是分离的。一个技术人员可以轻而易举地采用标准的纯化方法来获得一种分离蛋白。
本发明的蛋白质还包括SEQ ID NO2,4,6,8,10,12,14或18的剪接变体和插入、缺失或保守氨基酸取代变异体。本文中的保守变异体是指对蛋白质的生物学功能不产生负作用的氨基酸序列的改变。当改变的序列阻碍或破坏蛋白质的相关生物学功能时,取代、插入或缺失被认为对蛋白质具有副作用。例如,蛋白质的整体带电性、结构或疏水性/亲水性在某些情况下是可以被改变的,而对生物学活性则不产生副作用。因此,可以改变氨基酸的序列从而提供疏水性或亲水性更强的肽而对蛋白质的生物学活性不产生副作用。
通常,等位变体、保守取代变异体和由LBFL301编码的蛋白质家族的成员具有的氨基酸序列与SEQ ID NO2或4所示的序列具有至少约50%,60%,70%或75%的氨基酸序列相同性,更优选地至少约80-90%,甚至更优选地至少约92-95%以及最优选地至少约95-98%的序列相同性。等位变体、保守取代变异体和由LBFL304编码的蛋白质家族的成员具有的氨基酸序列与SEQ ID NO6,8,10或12所示的序列具有至少约50%,60%,70%或75%的氨基酸序列相同性,更优选地至少约80%,甚至更优选地至少约92-95%以及最优选地至少约99%或99.5%的序列相同性。等位变体、保守取代变异体和由LBFL305或LBFL306编码的蛋白质家族的成员具有的氨基酸序列与SEQ ID NO14或18所示的序列具有至少约50%,60%,70%或75%的氨基酸序列相同性,更优选地至少约80-90%,甚至更优选地至少约92-94%以及最优选地至少约95%,98%或99%的序列相同性。关于这种序列的相同性或同源性在本文中被定义为当进行序列比对和引入缺口(如果必要)以获得最大百分比的同源性后,候选序列中的与SEQ ID NO2,4,6,8,10,12,14或18相同的氨基酸残基的百分比,其中不考虑将任何保守取代作为序列相同性的一部分(参见B部分中的相关参数)。认为融合蛋白或肽序列中的N-端、C-端或内部延长、缺失或插入并不影响同源性。
因此,本发明的蛋白质包括具有SEQ ID NO2,4,6,8,10,12,14或18所示的氨基酸序列的分子;其具有这些蛋白质的至少约3,4,5,6,10,15,20,25,30,35或更多个氨基酸残基的连续序列的片段;所公开的编码序列的N-或C-端或内部已被插入一个或多个氨基酸残基而生成的氨基酸序列变异体;和被公开的序列的氨基酸序列变异体或其如上定义已被至少一个残基取代的片段。也被称作肽或多肽的这种片段可含有蛋白质的抗原区域、功能区域,这些区域被确认为是对应于已知蛋白结构域的氨基酸序列区域,其还可含有强亲水性区域。利用常规获得的蛋白序列分析软件如MacVector(OxfordMolecular)可以轻而易举地鉴定出所述的所有区域。
所预期的变异体还包括那些含有通过例如同源性重组、定点或PCR诱变所进行的预定突变的变异体,和包括但不限于兔子、小鼠、大鼠、猪、牛、羊、马和非人类灵长目动物品种在内的其它动物品种的相应蛋白质,和等位基因或蛋白家族的其它自然存在的变异体(例如,一种与对应于GenBank序列号为XM_128002,XM_129365,NM_021420,NM_133971(DNA序列)的小鼠蛋白和NP_598732(蛋白质序列)具有相似性的小鼠类似物,所有这些内容被引入本文作为参考)。其它变异体包括其中蛋白质已经通过取代的、化学的、酶的或其它适当的方法用除自然存在的氨基酸以外的其它部分(例如一种可测部分如酶或放射性同位素)进行了共价修饰的衍生物。
本发明还提供了含有本发明的蛋白或多肽和稀释剂的组合物。合适的稀释剂可以是水性或非水性溶剂或其组合物,并且可含有其它增加所述蛋白质或多肽的稳定性、溶解性、活性和/或贮存期的组分,例如水溶性盐或甘油。
如下所述,可以使用蛋白质家族中的成员(1)来识别调控该蛋白质的水平或至少一种活性的介质,(2)来识别蛋白质的结合配偶体,(3)作为抗原以产生多克隆或单克隆抗体,(4)作为一种治疗剂或靶标和(5)作为胃癌和其它增生疾病的诊断试剂或标记物。
B.核酸分子
本发明还提供了编码如SEQ ID NO2,4,6,8,10,12,14或18所示的蛋白质及本文记载的相关蛋白质的核酸分子,优选地是以分离的形式存在。本文中使用的“核酸”被定义为如下列的RNA或DNA编码上述蛋白或肽;与编码这种肽的核酸序列互补;与SEQ ID NO1,3,5,7,9,11,13或17所示的核酸杂交并且在合适的严紧条件下仍然与其稳定结合;编码与SEQ ID NO2或4的肽序列具有至少约50%,60%,70%或75%,优选地至少约80-90%,更优选地至少约92-95%以及最优选地至少约95-98%或更高相同性的多肽;与SEQ ID NO1或3的可读框具有至少50%,60%,70%或75%,优选地至少约80-90%,更优选地至少约92-95%以及甚至更优选的至少约95-98%或更高的核苷酸序列相同性;编码与SEQ ID NO6,8,10或12的肽序列具有至少约50%,60%,70%或75%,优选地至少约80%,更优选地至少约85%以及最优选地至少约90%,95%,98%,99%,99.5%或更高相同性的多肽;与SEQ ID NO5,7,9或11的可读框具有至少50%,60%,70%或75%,优选地至少约80%,更优选地至少约85%和甚至更优选地至少约90%,95%,98%,99%,99.5%或更高的核苷酸序列相同性;编码与SEQID NO14或18的肽序列具有至少约50%,60%,70%或75%,优选的至少约80-90%,更优选地至少约92-94%以及最优选地至少约95%,98%,99%或更高相同性的多肽;或者与SEQ ID NO13或17的可读框具有至少50%,60%,70%或75%,优选地至少约80-90%,更优选地至少约92-94%,和甚至更优选的至少约95%,98%,99%或更高的核苷酸序列相同性。
本发明还包括与SEQ ID NO1,3,5,7,9,11,13或17的互补链进行特异性杂交的分离的核酸分子,具体地是与可读框进行特异性杂交的分子。与SEQ ID NO1,3,5,7,9,11,13或17的互补链进行特异性杂交的这种分子一般是在严紧的杂交条件下进行杂交的。
具体预期的是基因组DNA,cDNA,mRNA和反义分子以及基于自然界来源或合成的可替代性主链或包含替代性碱基的核酸。然而,这种杂交或互补核酸被进一步定义为相对于现有技术中的核酸是新的和非显而易见性的,所述核酸包括编码本发明的蛋白质、在适当严紧条件下与编码本发明的蛋白质的核酸杂交或与编码本发明的蛋白质的核酸互补的核酸。
核苷酸或氨基酸序列水平的同源性或相同性通过BLAST(BasicLocal Alignment Search Tool)分析法来测定,所述分析法利用特意为序列相似性检索而改进的程序blastp,blastn,blastx,tblastn和tblastx(Altschul等,(1997)Nucleic Acids Res253389-3402,和Karlin等,(1990)Proc Natl Acad SciUSA 872264-2268,两者被全部引入作为参考)所使用的算法。BLAST程序所采用的方法首先考虑了查询序列与数据库序列之间的具有或不具有缺口的相似片段,然后评价所有被识别的匹配物的统计学显著性并且最终仅仅加和那些满足显著性预选阈值的匹配物。为了讨论序列数据库相似性检索的基本问题,参见Altschul等,(1994)Nature Genetics 6119-129,其内容被全部引入作参考。将直方图(histogram)、描述项(descriptions)、序列比对(alignments)、期待值(expect)(即用于反映相对于数据序列的匹配物的统计学显著性阈值)、截止(cutoff)、矩阵和过滤器(低复杂性)的检索参数设置在默认值。blastp,blastx,tblastn和tblastx所采用的默认评分矩阵是BLOSUM62矩阵(Henikoff等,(1992)Proc Natl Acad Sci USA8910915-10919,被全部引入作为参考),被推荐用于长度超过85个核苷酸或氨基酸的查询序列。
对于blastn,所述评分矩阵被设置成M(即匹配残基的奖励评分)与N(即错配残基的罚分)的比例,其中M和N的默认值分别为5和-4。四个blastn参数按照以下方式进行调节Q=10(缺口产生罚分);R=10(缺口延伸罚分);wink=1(查询序列的每个winkth位置产生字串命中值);和gapw=16(设定其中产生缺口比对的窗口宽度)。Blastp的相应参数设定值是Q=9;R=2;wink=1;和gapw=32。10.0版本的GCG软件包中用于序列比较的Bestfit采用了DNA参数GAP=50(缺口产生罚分)和LEN=3(缺口延伸罚分)以及蛋白质比较过程中相应的设定值是GAP-8和LEN=2。
“严紧条件”是如下(1)采用了低离子强度和高温进行冲洗,例如在50℃下利用0.015M NaCl/0.0015M柠檬酸钠/0.1%SDS进行冲洗,或(2)在杂交过程中采用了变性剂如甲酰胺,例如在42℃下50%(vol/vol)的甲酰胺与0.1%牛血清白蛋白/0.1%Ficoll/0.1%聚乙烯吡咯烷酮/50mM pH 6.5的磷酸钠缓冲液与750mM NaCl,75mM柠檬酸钠。另一个例子是于42℃下在50%甲酰胺,5×SSC(0.75M NaCl,0.075M柠檬酸钠),50mM的磷酸钠(pH 6.8),0.1%的焦磷酸钠,5×Denhardt溶液,超声处理的鲑精DNA(50μg/ml),0.1%SDS,和10%的葡聚糖硫酸酯中进行的杂交,并在42℃用0.2×SSC和0.1%SDS进行冲洗。技术人员能够轻而易举地适当确定和改变严紧条件从而获得清晰的和可检测的杂交信号。优选的分子是那些在上述条件下与SEQ ID NO1,3,5,7,9,11,13或17的互补链杂交并且编码具有功能的或全长蛋白质的分子。更优选的杂交分子是那些在上述条件下与SEQ ID NO1,3,5,7,9,11,13或17的可读框的互补链杂交的分子。
如本文中使用的,当核酸分子基本上从编码其它多肽的杂质核酸分子中分离时,所述核酸分子被认为是“分离的”。
本发明还提供了被公开的核酸分子的片段。本文中使用的核酸分子片段是指编码或非-编码序列的小的部分。片段的大小由使用目的来决定。例如,如果所述片段被选择用来编码所述蛋白质的活性部分,那么该片段则需要足够大以便编码所述蛋白的功能域。例如可以制备编码对应于预测抗原区域的肽的片段。如果所述片段被用作核酸探针或PCR引物,那么则需要对所述片段的长度进行选择从而使得探测/引发过程中出现的假阳性的数目较小(参见H部分的讨论)。
本发明被用作聚合酶链反应(PCR)的探针或特定引物或用来合成编码本发明的蛋白质的基因序列的核酸分子片段(即合成的寡核苷酸)可以通过化学技术,例如Matteucci等的亚磷酰胺技术((1981)J AmChem Soc 1033185-3191)或利用自动合成法来轻而易举地得到。另外,大的DNA片段可以通过已经通晓的方法来制备,诸如合成一组限定该基因各个模块片段的寡核苷酸,接着连接这些寡核苷酸从而构建出完整的修饰基因。
本发明的核酸分子还可以被修饰成含有用于诊断和探针目的的可测标记物。许多这种标记物在本技术领域中是已知的并且可以轻易用于本文记载的编码分子。合适的标记物包括但不限于生物素、放射性或荧光标记的核苷酸等。技术人员可以轻而易举地采用任何这种标记物来获得本发明的核酸分子的标记变异体。
C.其它相关核酸分子的分离
如上所述,具有SEQ ID NO1,3,5,7,9,11,13或17所示序列的核酸分子的鉴定和表征允许技术人员分离除本文记载的序列以外的编码该蛋白质家族中的其它成员的核酸分子。而且,本文公开的核酸分子允许技术人员分离除具有SEQ ID NO2,4,6,8,10,12,14或18所示序列的蛋白质以外的编码蛋白质家族的其它成员的核酸分子。
例如,技术人员可以轻易地利用SEQ ID NO2,4,6,8,10,12,14或18的氨基酸序列来制备抗体探针以便筛选从合适的细胞中制备的表达文库。典型地,得自哺乳动物如经纯化蛋白免疫的兔子(如下所述)的多克隆抗血清或单克隆抗体可以被用来探测哺乳动物的cDNA或基因组表达文库,诸如λgt11文库,从而获得编码蛋白质家族其它成员的合适序列。被克隆的cDNA序列可以以融合蛋白的形式进行表达,直接利用其自身的调控序列进行表达或通过利用适于用于表达酶的特定宿主的调控序列经构建体来进行表达。
或者,可以合成本文记载的编码序列的一部分片段并将其用作检测DNA的探针,该DNA编码源自哺乳动物的蛋白质家族的成员。制备含约18-20个核苷酸的低聚物(编码约6-7个氨基酸的片段)并将其用来筛选基因组DNA或cDNA文库从而实现在能够消除过高水平的假阳性的严紧条件或充分严紧的条件下的杂交。
另外,可以制备用于聚合酶链式反应(PCR)的寡苷酸引物对以便选择性地克隆一种编码核酸分子。利用这种PCR引物的PCR变性/退火/延伸循环在本技术领域中是熟知的并且非常适用于分离其它编码核酸分子。
利用任何可获得的算法,包括但不限于PSI-BLAST(Altschul等,(1997)Nucleic Acids Res 253389-3402);PHI-BLAST(Zhang等,(1998)Nucleic Acids Res 263986-3990),3D-PSSM(Kelly等,(2000)J Mol Biol 299(2)499-520)和其它计算分析方法(Shi等,(1999)Biochem Biophys Res Commun 262(1)132-138和Matsunami等,(2000)Nature 404(6778)601-604),还可以在已有基因组或其它序列中鉴定出编码蛋白质家族其它成员的核酸分子。
D.含核酸分子的rDNA分子
本发明还提供了含有编码序列的重组DNA分子(rDNAs)。本文中使用的rDNA分子是一种已经进行了原位分子操纵的DNA分子,用于产生rDNA分子的方法在本技术领域中是已知的,例如参见Sambrook等,Molecular Cloning-A Laboratory Manual,第三版,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY,2001。在优选的rDNA分子中,DNA编码序列与表达控制序列和/或载体序列进行了可操作性的连接。
正如本技术领域所熟知的,可操作性地连接于本发明的蛋白家族编码序列的载体和/或表达控制序列的选择直接依赖于所需要的功能特性,例如蛋白质的表达,和待转化的宿主细胞。本发明所预期的载体至少能够指导rDNA分子中所含的结构基因在宿主染色体中的复制和插入,而且优选地还能指导rDNA分子中所含结构基因的表达。
被用于调节可操作连接的蛋白编码序列的表达的表达控制元件在本技术领域中是已知的,并且包括但不限于诱导型启动子、组成型启动子、分泌信号和其它调节元件。优选地,所述诱导型启动子容易得到控制,诸如响应于宿主细胞培养基的营养成分。
在一个实施方案中,含有编码核酸分子的载体包括原核复制子,即一种能够指导自主复制和将重组DNA分子保持在经其转化的原核宿主细胞如细菌宿主细胞的染色体外的DNA序列。这种复制子在本技术领域中是已知的。另外,含有原核复制子的载体还可包括其表达产生一个可检测标记物如抗药性的基因。典型的细菌抗药性基因是那些对氨苄青霉素、卡那霉素、氯霉素或四环素具有抗性的基因。
含有原核复制子的载体可包含能够指导编码基因序列在细菌宿主细胞如大肠杆菌中进行表达(转录和翻译)的原核或噬菌体启动子。启动子是由允许RNA聚合酶的结合和转录进行的DNA序列形成的一种表达控制元件。适用于细菌宿主的启动子序列通常以质粒载体的形式来提供,所述质粒载体含有方便的限制性位点用于插入本发明的DNA片段。这种载体质粒的典型实例是从BioRad实验室(Richmond,CA)得到的pUC8,pUC9,pBR322和pBR329,从Pharmacia(Piscataway,NJ)得到的pPL和pKK223。
适用于真核细胞的表达载体,优选地是那些适用于脊椎动物细胞诸如胃细胞的表达载体,还可被用来制备含编码序列的rDNA分子。包括病毒载体在内的真核细胞表达载体在本技术领域中是已知的并且购自几个商业途径。通常,这种载体是以含有适于插入所需DNA片段的限制位点的形式提供。这种载体的典型实例是pSVL和pKSV-10(Pharmacia),pBPV-1/pML2d(Interna tionational Biotechnologies,Inc.),pTDT1(ATCC,#31255),本文记载的载体pCDM8以及类似真核表达载体。如果需要,载体可以被修饰以含有胃细胞特异性启动子。
被用于构建本发明rDNA分子的真核细胞表达载体还可含有在真核细胞中有效的选择性标记物,优选地是一种药物抗性选择标记物。一种优选的药物抗性标记物是其表达产生新霉素抗性的基因,即新霉素磷酸转移酶(neo)基因(Southern等,(1982)J Mol Anal Genet1327-341)。或者,选择性标记物可以存在于分开的质粒上,而且,两个载体通过共-转染宿主细胞而被引进,并且通过在适于该选择性标记物的合适药物中进行培养来进行选择。
E.含外源编码核酸分子的宿主细胞
本发明还提供了被编码本发明蛋白质的核酸分子转化的宿主细胞。所述宿主细胞既可以是原核细胞也可以是真核细胞。用于表达本发明蛋白质的真核细胞不受什么限制,只要所述细胞系适于细胞培养方法并适于表达载体的增殖和基因产物的表达就行。优选的真核宿主细胞包括但不限于酵母、昆虫和哺乳动物细胞,优选脊椎动物细胞,如那些源自小鼠、大鼠、猴子或人细胞系的细胞。优选的真核宿主细胞包括得自ATCC的中国仓鼠卵巢(CHO)细胞CCL61,得自ATCC的NIH瑞士小鼠胚胎细胞(NIH/3T3)CRL 1658,幼小仓鼠肾细胞(BHK)和类似真核组织培养细胞系。
任何原核宿主可以被用来表达编码本发明蛋白质的rDNA分子。优选的原核宿主是大肠杆菌。
利用本发明的rDNA分子对适当宿主细胞进行的转化可以通过取决于所用载体和宿主系统类型的已知方法来实现。针对原核宿主细胞的转化,通常采用电穿孔和盐处理方法(参见,例如Cohen等,(1972)Proc Natl Acad Sci USA 692110;和Sambrook等,上文)。针对利用含rDNA分子的载体对脊椎动物细胞进行的转化,通常采用电穿孔、阳离子脂质或盐处理方法,参见例如Graham等,(1973)Virol 52456;Wigler等,(1979)Proc Natl Acad Sci USA 76;1373-1376。
被成功转化的细胞,即含本发明rDNA分子的细胞,可以通过包括筛选选择性标记物的方法在内的已知技术进行鉴定。例如,可以克隆出引入本发明的rDNA的细胞以便制备单个菌落。得自这些菌落的细胞被收集和溶胞后,利用诸如由Southern,(1975)J Mol Bio l98503或Berent等,(1985)Biotech 3208记载的方法进行DNA含量检测以便确定rDNA的存在,或通过免疫学方法测定产自所述细胞的蛋白质。
F.利用rDNA分子生产重组蛋白质
本发明还提供了利用本文记载的核酸分子生产本发明蛋白质的方法。总之,重组形式的蛋白质的生产通常包括下列步骤
首先,得到编码本发明蛋白质的核酸分子,诸如下列、基本由下列组成或由下列组成的核酸分子SEQ ID NO1,SEQ ID NO3,SEQID NO5,SEQ ID NO7,SEQ ID NO9,SEQ ID NO11,SEQ ID NO13,SEQ ID NO17,SEQ ID NO1的131-862位或131-859位核苷酸,SEQ ID NO3的174-587位或174-584位核苷酸,SEQ ID NO5的38-892位或38-895位核苷酸,SEQ ID NO7的53-892位或53-895位核苷酸,SEQ ID NO9的65-892位或65-895位核苷酸,或SEQ IDNO11的92-892位或92-895位核苷酸,或SEQ ID NO13的49-1437位或49-1434位核苷酸,或SEQ ID NO17的75-575位或75-572位核苷酸。如果编码序列不被内含子所打断,如这些可读框,那么所述编码序列直接适用于在任何宿主中进行表达。
其次,如上所述,所述核酸分子优选地与合适的控制序列可操作性地连接从而形成一种含有蛋白可读框的表达单位。该表达单位被用于转化合适的宿主以及在能使重组蛋白产生的条件下培养该转化宿主。所述重组蛋白质可选择性地分离自培养基或细胞;在可以容忍某些杂质的情况下,所述蛋白的回收和纯化不是必需的。
上述每一个步骤能以各种方式进行。例如,所需的编码序列可以从基因组片段中获得并被直接用于合适的宿主中。如上所述,可以在各种宿主中操作的表达载体的构建是通过利用合适的复制子和控制序列完成的。控制序列、表达载体和转化方法取决于被用于表达基因的宿主细胞的类型并且已在以前进行过详细讨论。如果不能正常得到,可以将合适的限制位点加到编码序列的末端从而提供一种可剪切基因以便插入到这些载体中。一个技术人员可以轻而易举地对本技术领域中已知的宿主/表达系统进行改造以便适用于本发明的核酸分子来产生重组蛋白。
G.鉴定结合配偶体的方法
技术领域:
本发明的另一个技术方案提供了用于分离和鉴定本发明的结合配偶体的方法。总之,在能使潜在的结合配偶体与本发明的蛋白质结合的条件下将本发明的蛋白质与所述的潜在配偶体或细胞的提取物或级分相混合。混合后,从所述混合物中分离出结合了本发明蛋白质的肽、多肽、蛋白质或其它分子。然后除去与本发明蛋白质结合的结合配偶体并进一步进行分析。为了鉴定和分离结合配偶体,可以利用完整蛋白,例如含有SEQ ID NO2,4,6,8,10,12,14或18的全长氨基酸序列的蛋白。或者,可以利用所述蛋白的片段。
本文中使用的细胞提取物是指由溶胞的或裂解的细胞制得的制品或级分。优选的细胞提取物的来源是得自人胃肿瘤或被转化的胃细胞的细胞,例如来源于胃癌的活检组织或组织培养细胞。或者,可以由正常组织或可得到的细胞系,尤其是得自胃的细胞系,来制备细胞提取物。
可以使用多种方法来获得细胞提取物。利用物理或化学裂解方法可以将细胞裂解。物理裂解方法的实例包括但不限于超声处理和机械剪切,化学溶胞方法的实例包括但不限于去污剂溶胞和酶溶胞。一名技术人员可以轻而易举地对制备细胞提取物的方法进行改变以便获得用于本发明的提取物。
一旦制备出细胞提取物,就在能使本发明的蛋白与结合配偶体进行结合的条件下将该提取物与本发明的蛋白质相混合。可以采用多种条件,最优选的是与人类细胞的胞质中的条件极其相似的条件。可以改变诸如摩尔渗透压浓度、pH、温度和所用细胞提取物的浓度的特性以便使所述蛋白质与结合配偶体的结合达到最佳状态。
在适当条件下混合后,从所述混合物中分离出结合的复合体。可以利用多种技术来对所述混合物进行分离。例如,特异于本发明蛋白质的抗体可以被用来免疫沉淀所述结合配偶体复合物。或者,可以采用标准化学分离技术如色谱法和密度/沉淀离心。
当除去所述提取物中的未结合细胞成分后,利用常规的方法就可以使结合配偶体从复合体中解离。例如,通过改变所述混合物的盐浓度或pH可以实现解离的目的。
为了有助于从所述混合提取物中分离出结合的结合配偶体对子,可以将本发明的蛋白质固定在固相载体上。例如,可以将蛋白质连接在硝化纤维素基质或丙烯酸珠子上。所述蛋白与固相载体的连接有助于从所述提取物中的其它组分中分离出肽/结合配偶体对子。被鉴定出来的结合配偶体可以是单一蛋白或由两种或多种蛋白组成的复合体。或者,可以利用在Takayama等,(1997)Methods Mol Biol 69171-184或Sauder等,(1996)J Gen Virol 77991-996中记载的方法用Far-Western测定法来鉴定结合配偶体,或者通过利用表位标记的蛋白或GST融合蛋白来鉴定结合配偶体。
或者,本发明的核酸分子可被用于酵母双杂交系统中或其它体内蛋白-蛋白检测系统。酵母双杂交系统已被用来鉴定其它蛋白质配偶体对子,并可以被适当地改变从而适用于本文所记载的核酸分子。
H. 鉴定调控编码胃癌相关基因的核酸的表达的介质的方法
技术领域:
本发明的另一个实施例提供了用于鉴定调控编码本发明蛋白的核酸的表达的介质的方法,所述本发明蛋白诸如是具有SEQ ID NO2,4,6,8,10,12或18所示氨基酸序列的蛋白或Mst1蛋白或本发明的剪接变体,如具有SEQ ID NO14所示氨基酸序列的蛋白。调控编码Mst1蛋白或剪接变体的核酸的表达的介质在治疗胃癌中具有特定的用途。这种测定法可以利用任何有效检测手段来检测本发明核酸的表达水平。只要本文中的介质能够上调或下调所述核酸在细胞中的表达,那么就认为其能调控本发明核酸的表达。
在一种测定形式中,可制备出在下列核苷酸和任何可检测的融合配偶体之间的报道基因融合体由SEQ ID NO1的131-862位核苷酸、SEQ ID NO3的174-587位核苷酸、SEQ ID NO5的38-895位核苷酸、SEQ ID NO7的53-895位核苷酸、SEQ ID NO9的65-895位核苷酸、SEQ ID NO11的92-895位核苷酸、SEQ ID NO13的49-1437位或49-1434位核苷酸、SEQ ID NO17的75-575位核苷酸所定义的可读框和/或5’和/或3’调节元件。包括萤火虫荧光素酶基因和编码氯霉素乙酰转移酶在内的大量可测定融合配偶体是已知的并且容易得到(Alam等,(1990)Anal Biochem 188245-254)。然后在适当条件和时间下使含报道基因融合体的细胞系与待测的介质进行接触。接触所述介质的样品与对照样品之间的报道基因的差异表达能够鉴定调控本发明核酸表达的介质。
可以采用其它测定形式来监测介质调控核酸表达的能力,所述核酸编码本发明蛋白质,诸如具有SEQ ID NO2,4,6,8,10,12,14或18所示序列的蛋白质。例如,mRNA表达可以直接通过与本发明的核酸进行杂交来监测。在适当条件和时间下细胞系与待测介质进行接触并且总RNA或mRNA通过常规方法如那些被公开于Sambrook等,Molecular Cloning-A Laboratory Manual,Third Ed.,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY,2001中的方法而得到分离。
优选的细胞是那些得自人胃组织,例如,胃活检组织的细胞或源自胃癌患者的培养细胞。可以使用细胞系如目录号为NCI-SNU-16,CRL-1863,HTB-103,CRL-1739和CRL-1864的ATCC胃癌细胞系。或者,可以使用其它可得到的细胞或细胞系。
用于检测接触了所述介质的细胞与对照细胞之间的RNA表达水平差异的探针可以由本发明的核酸来制备。更好地是,但不是必需的,设计仅与靶核酸在高严紧条件下进行杂交的探针。在高严紧条件下仅仅形成高度互补的核酸杂交体。因此,测定条件的严紧性决定两条核酸链之间为了形成杂交体应该存在的互补量。应当对严紧性进行选择从而使探针靶标杂交体与探针非靶标杂交体之间的稳定性差异最大化。
可以通过本领域中的已知方法由本发明的核酸设计探针。例如,探针的G+C含量和探针的长度能够影响探针与其靶序列的结合。使探针特异性最佳化的方法通常被记载在Sambrook等,上文,或Ausubel等,Short Protocols in Molecular Biology,第四版,John Wiley& Sons,Inc.,New York,1999中。
根据每一探针的需要,杂交条件利用已知方法来改变,所述已知方法诸如是由Sambrook等和Ausubel等记载的方法。总细胞RNA或富集了聚腺苷酸RNA的RNA的杂交能以任何可用形式得到实现。例如,在探针进行特异性杂交的条件下,总细胞RNA或富集了聚腺苷酸RNA的RNA可以被附着于固相载体,固相载体暴露于至少一种含有本发明的至少一种序列或本发明的一种序列的部分序列的探针。或者,含本发明的至少一种序列或本发明的一种序列的部分序列的核酸片段可以被附着于固相载体上,所述固相载体例如是硅片、多孔玻璃胶片或膜。然后在被附着的序列进行特异性杂交的条件下使所述固相载体与得自样品的总细胞RNA或聚腺苷酸RNA接触。这种固相载体和杂交方法是广泛可用的,例如由Beattie,(1995)WO 95/11755公开的方法。通过检测给定探针与源自未处理细胞群和与所述介质接触的细胞群的RNA样品进行特异性杂交的能力,可以鉴定出上调或下调核酸表达的介质,该核酸编码具有SEQ ID NO2,4,6,8,10,12,14或18所示序列的蛋白质。
通过利用RNase Protection Assay(即RPA,参见Ma等,(1996)Methods 10273-238)也可以实施适用于对mRNA进行定性和定量分析的杂交。简要地说,含编码基因产物的cDNA和噬菌体特定DNA依赖性RNA聚合酶启动子(例如T7,T3或SP6 RNA聚合酶)的表达载体在cDNA分子的3’端,噬菌体启动子的下游,被线性化,其中这种线性化分子被随后用作合成cDNA的被标记的反义转录物的模板,所述反义转录物是通过体外转录得到的。然后通过在含80%甲酰胺、40mM Pipes,0.4M NaCl和1mM EDTA的pH为6.4的缓冲液中进行45℃的过夜孵育来使被标记的转录物与被分离的RNA混合物(即总mRNA或分级的mRNA)进行杂交。然后在含40μg/ml核糖核酸酶A和2μg/ml核糖核酸酶的缓冲液中对所得到的杂交体进行消化。在使外来蛋白质失活并提取外来蛋白质后,将样品加载到分析用的尿素/聚丙烯酰胺凝胶上。
在另一个分析方法中,为了鉴定影响本发明基因产物表达的介质,首先鉴定生理表达本发明基因产物的细胞或细胞系。如此鉴定的细胞和/或细胞系可望含有必需的细胞结构以便当介质进行体外接触时转录结构的调控保真度被维持,所述介质具有适当的表面转导机制和/或胞质级联传导。而且,这种细胞或细胞系被表达载体(例如质粒或病毒载体)构建物转导或转染,所述表达载体构建物含有融合于一个或多个抗原性片段上的编码本发明基因产物的结构基因的可操作的非翻译5′末端(该末端含有启动子),所述抗原性片段对于本发明基因产物来说是独特的,其中所述片段处于所述启动子的转录控制下并以其分子量不同于天然多肽的多肽形式进行表达或进一步含有免疫上不同的标签或其它可检测标记物。这种方法在本技术领域中是已知的(参见Sambrook等,见上文)。
然后在适当的条件下使上述被转导或转染的细胞或细胞系与介质接触。例如,药学可接受赋形剂中的介质与含水生理缓冲液如生理pH的磷酸盐缓冲液(PBS)、生理pH的Eagles平衡盐溶液(BSS)、含血清的PBS或BSS或者37℃下温育的含PBS或BSS和/或血清的条件培养基中的细胞接触。所述条件可以由本技术领域中的技术人员根据需要进行调节。细胞与所述介质接触后,将所述细胞进行裂解并且对溶胞产物的多肽进行分部分离,从而将多肽级分合并起来并且与抗体接触以通过免疫学测定方法进一步加工(例如,ELISA,免疫沉淀或蛋白质印迹)。将从“介质-接触的”样品中分离的蛋白的合并物与其中只有赋形剂与细胞接触的对照样品进行比较,并且由“介质-接触的”样品所产生的免疫学信号相对于对照物的增强或减弱来识别所述介质的有效性。
I.调控胃癌相关蛋白的水平或至少一种活性的介质的识别方法
技术领域:
本发明的另一个实施方案提供了用于鉴定调控本发明蛋白或本发明的Mst1蛋白或剪接变体的水平或至少一种活性的介质的方法,所述本发明蛋白例如是具有SEQ ID NO2,4,6,8,10,12或18的氨基酸序列的蛋白,所述本发明的Mst1蛋白或剪接变体例如是具有SEQID NO14的氨基酸序列的蛋白。这种方法或测定方法可以利用任何监控或检测所需活性的手段。
在一种情况下,可以检测与待测介质接触过的细胞群相对于未接触的对照细胞群的本发明蛋白的相对含量。在这种情况下,探针诸如特定抗体被用来监控所述蛋白在不同细胞群中的差异表达。在适当条件下和时间内使细胞系或细胞群与所述介质接触。可以从接触过的细胞系或细胞群和未接触过的对照细胞系或细胞群中制备细胞溶胞产物。然后利用探针对该细胞溶胞产物进行分析。
如果本发明的肽、多肽或蛋白质足够长,或如果需要,或如果需要加强免疫原性,则将所述肽、多肽或蛋白质结合到适当的载体上,就在适当的免疫方案中通过利用本发明的所述肽、多肽或蛋白质免疫合适的哺乳动物宿主来制备抗体探针。用于制备结合在载体如BSA,KLH或其它载体蛋白上的免疫原性缀合物的方法在本技术领域中是已知的。在某些情况下,利用例如碳二亚胺试剂直接进行缀合可能是有效的;在其它情况下,可能需要连接试剂如那些由Pierce ChemicalCo.(Rockford,IL)提供的连接试剂来提供对半抗原的可接近性。例如为了便于与载体进行连接,所述半抗原肽可以用半胱氨酸残基在氨基或羧基端进行延伸,或用半胱氨酸残基进行点缀。如本技术领域中所知晓的,通常通过适当长时间的注射和利用合适的佐剂来施用免疫原。在免疫程序中,测定抗体滴度以确定足够抗体的形成。
尽管以这种方式产生的多克隆抗血清可以满足某些用途,但对于药物组合物,单克隆制备物的利用是优选的。众所周知,可以利用Kohler和Milstein((1975)Nature 256495-497)的标准方法或引起淋巴细胞或脾细胞的无限增殖的改进方法来制备分泌所需单克隆抗体的永生化细胞系。分泌所需抗体的无限增殖细胞系通过其中抗原是肽半抗原、多肽或蛋白质的免疫分析法来筛选。当鉴定了分泌所需抗体的适当的无限增殖细胞培养物后,可以体外培养所述细胞或通过利用腹水来制备所述细胞。
然后从培养上清中或从腹水上清中回收所需单克隆抗体。含有免疫学显性(抗原-结合)部分的单克隆抗体片段或多克隆抗血清以及完整抗体可被用作拮抗剂。利用免疫反应(抗原-结合)性抗体片段,诸如Fab,Fab’或F(ab’)2片段通常是优选的,尤其是在治疗方面,因为这些片段的免疫原性通常比完整免疫球蛋白的免疫源性小。
抗体或抗原-结合型片段还可以利用现有技术,通过重组手段来生产。与所述蛋白的所需区域特异结合的抗体区域可以产生于多个物种来源的嵌合体中,诸如人源化抗体中。
可以对以上述方法测定的介质进行随机选择或理性选择或设计。本文中的介质是随机选择的,这里指这样的介质是随机选择的而没有考虑参与与本发明蛋白单独结合或联合相关的底物、结合配偶体等与本发明蛋白结合的特定序列。随机选择的介质的实例是利用化学文库或肽组合文库或微生物培养肉汤。
当在考虑了靶位点的序列和/或与所述介质的作用有关的构象的非随机基础上选择本文使用的介质时,所述介质被认为是理性选择或设计的。可以利用组成这些位点的肽序列对介质进行理性的选择或设计。例如,理性选择的肽介质可以是其氨基酸序列与任何功能性共有序列位点相同的肽或其氨基酸序列是任何功能性共有序列位点的衍生物的肽。
本发明的介质可以是,例如肽、小分子、维生素衍生物以及碳水化合物。可以将显性失活蛋白,编码这些蛋白的DNA、针对这些蛋白的抗体、这些蛋白的肽片段或这些蛋白的模拟物引进细胞来实现功能。本文使用的“模拟物”是指对肽分子的一个区域或几个区域进行修饰从而使其化学结构有别于母本肽而拓扑学和功能却类似于母本肽(参见GrantMolecular Biology and Biotechno logy,Meyers编辑,659-664页,VCH Publishers,Inc.,纽约,1995)。技术人员可以轻而易举地得知本发明介质的结构特性不受限定。
本发明的肽介质可以利用在本技术领域中已知的标准固相(或液相)肽合成法来制备。另外,编码这些肽的DNA可以利用商购寡核苷酸合成仪来合成并且利用常规重组生产体系来进行重组制备。如果包含非基因编码氨基酸,那么利用固相肽合成法的生产则成为必需。
本发明的另一种介质是与本发明蛋白的关键位点发生免疫反应的抗体。抗体介质通过用肽对合适哺乳动物主体进行免疫而获得,所述肽含有要作为所述抗体的靶标的那些蛋白部分作为免疫原性区域。
J.调控胃癌相关蛋白的表达或至少一种活性的介质的用途
如实施例所提供的,本发明的蛋白和核酸,诸如具有SEQ ID NO2,4,6,8,10,12或18所示氨基酸序列的蛋白,和本发明的Mst1或Mst1剪接变体蛋白和核酸,诸如具有SEQ ID NO14所示氨基酸序列的蛋白,在胃癌组织进行差异性表达。上调或下调或调控蛋白质表达或蛋白质至少一种活性的介质,诸如激动剂或拮抗剂,可以被用来调控与蛋白质功能和活性有关的生物和病理的过程。
例如,两种类型的药物已经被证明通过Mst1(例如,GenBank序号为NM_006282,核酸序列和蛋白序列分别如SEQ ID NO15和16所示),一种与SEQ ID NOS13和14相关的基因,起作用。首先,已经证明二膦酸盐,即被用来治疗骨质疏松和其它骨病的药物,直接作用于破骨细胞从而在编程性细胞死亡的过程中诱导Mst1的caspase裂解。其次,cytotrienin A是一种被用来治疗白血病、乳腺癌和肺癌的抗肿瘤药物(美国专利US 6,251,885)。Cytotrienin A已经被证明在cytotrienin A-诱导的编程性细胞死亡过程中能够激活Mst1(Watabe等,(2000)J Biol Chem 2758766-8771)。
在本文中,主体可以是任何哺乳动物,只要所述哺乳动物需要调控由本发明的蛋白介导的病理学或生物学过程就行。术语“哺乳动物”被定义为是一种属于哺乳动物纲的个体。本发明被特别用于人体的治疗。
病理学过程是指一类产生有害作用的生物过程。例如,本发明的蛋白表达可能与胃细胞的生长或增生有关。在本文中,介质被认为能够调控病理学过程,就是指所述介质降低了所述过程的程度或严重性。例如,可以通过施用以某种方式上调或下调或调控本发明蛋白的表达或至少一种活性的介质来预防胃癌或调控疾病进展。
本发明的介质能以单独的形式进行提供,或者以与其它调控特定病理学过程的介质组合的形式来提供。例如,本发明的介质可以与其它已知药物联合进行施用。在本文中,当两种介质同时施用或以所述介质同时发挥作用的方式分别独立地施用时,所述两种介质就被认为是进行联合施用的。
本发明的介质可以通过非肠道、皮下、静脉内、肌内、腹膜内、透皮或口腔途径进行用药。替代性地,或同时地,可以通过口服进行用药。用药剂量将取决于受试者的年龄、健康和重量,共同治疗的类型(如果有的话),还取决于治疗的频率和所需作用的特性。
本发明进一步提供了含有一种或多种调控本发明蛋白的表达或至少一种活性的介质的组合物。尽管个体需要会变化,确定每个组分的有效量的优化范围是本技术领域中的技术人员所能控制的。典型的剂量含有0.1至100μg/kg体重。优选的剂量含有0.1至10μg/kg体重。最优选的剂量含有0.1至1μg/kg体重。
除了药理学活性介质外,本发明的组合物可以含有适当的药学可接受载体以递送至作用位点,该载体含有有利于将所述活性化合物加工成可被药学利用的制剂的赋形剂和辅剂。适用于非肠道用药的制剂包括水溶形式的活性化合物的水溶液,例如水溶性盐。另外,可以施用活性化合物的悬液例如合适的含油注射悬液。合适的亲脂性溶剂或载体包括脂肪油,例如芝麻油,或合成脂肪酸酯,例如乙基油酸酯或甘油三酯。注射用水悬液可以含有增加悬液粘度的物质,这种物质包括,例如,羧甲基纤维素钠、山梨醇和/或葡聚糖。任选地,所述悬液还可以含有稳定剂。脂质体也能被用来将所述介质包囊化以便输入到细胞内。
本发明的全身用药的药物制剂可以被配制成适于肠内、非肠道或局部用药。实际上,所有三种类型的制剂都可以被用来实现活性成分的全身用药。
合适的口服制剂包括硬明胶胶囊剂或软明胶胶囊剂、丸剂、片剂包括有包衣的片剂、酏剂、悬液、糖浆或吸入剂及其控释剂型。
为了实施本发明的方法,本发明的化合物可以进行单独使用,或以与其它治疗剂或诊断试剂联合的形式使用。在某些优选的实施例中,根据通常接受的医学实践,本发明的化合物可以与其它化合物一起共同施用,所述化合物被通常指定用于这些病症。本发明的化合物可以进行体内用药或体外用药,通常在哺乳动物体内用药,所述哺乳动物诸如是人、绵羊、马、牛、猪、狗、猫、大鼠和小鼠。
K.转基因动物
本发明也包括含有突变、敲除或修饰基因的转基因动物,所述基因对应于SEQ ID NO1,3,5,7,9,11,13或17所示的cDNA序列或编码SEQ ID NO2,4,6,8,10,12,14或18所示多肽序列或其具有至少约3,4,5,6,10,15,20,25,30,35或更多个氨基酸残基的连续序列的片段的可读框。转基因动物是其体内已通过实验转入了重组的、外源的或克隆的遗传物质的被遗传修饰的动物。这种遗传物质通常被称作“转基因”。在本案中,可以将SEQ ID NO1,3,5,7,9,11,13或17形式的转基因核酸序列整合到其中该特定核酸通常不存在的基因组的基因座上或整合到该转基因的正常基因座上。所述转基因可由得自相同物种或不同于靶动物物种的其它物种的基因组的核酸序列组成。
在某些实施方案中,可以构建其中缺失了含SEQ ID NO1,3,5,7,9,11,13或17所示基因的全部或部分片段的转基因动物。当对应于SEQ ID NO1,3,5,7,9,11,13或17的基因含有一个或多个内含子时,可以删除全长基因,即所有外显子、内含子和调控序列。或者,可以删除全长基因的一部分序列。例如,可以删除单个外显子和/或内含子,以便创建一种表达经修饰的本发明蛋白的动物。
术语“生殖细胞系转基因动物”是指其中生殖细胞进行了遗传改构或引入了遗传信息从而赋予了转基因动物将遗传信息传给后代的能力的转基因动物。如果这种后代事实上拥有了一部分或全部的遗传改构或遗传信息,那么它们也是转基因动物。
所述改构或遗传信息相对受体所属动物品种来说可以是外源的,仅相对该特定个体受体是外源的或者可以是已经被受体拥有的遗传信息。在最后一种情况下,被改构或引进的基因与天然基因的表达可能有差异。
转基因动物可以通过多种不同的方法来生产,所述方法包括转染、电穿孔、显微注射、基因在胚胎干细胞中的定位以及重组病毒和逆转录病毒传染(参见例如US专利号4736866;US专利号5602307;Mullins等,(1993)Hypertension 22630-633;Brenin等,(1997)Surg Oncol 699-110;Recombinant Gene Expression Protocols(Methods in Molecular Biology,Vol.62),Tuan编辑,Humana出版社,Totowa,NJ,1997)。
已经制备出许多重组或转基因小鼠,包括那些表达活化的致癌基因序列(US专利号4,736,866);表达猿SV40 T-抗原(US专利号5,728,915);不进行干扰素调控因子1(IRF-1)表达(US专利号5,731,490);表现出多巴胺能机能障碍(US专利号5,723,719);表达至少一种参与血压调控的人类基因(US专利号5,731,489);表现出与自然发生的阿尔茨海墨氏病中存在的症状更相似的症状(US专利号5,720,936);介导细胞粘附的能力降低(US专利号5,602,307);具有牛生长激素基因(Clutter等,(1996)Genetics 1431753-1760);或能够产生完全人体抗体应答(McCarthy(1997)Lancet 349405)的重组或转基因小鼠。
尽管小鼠和大鼠仍然是大多数转基因实验所选择的动物,但是,在某些情况下,优选地或必要地是利用其它动物品种。转基因方法已被成功用于多种非-鼠科动物,这些动物包括绵羊、山羊、猪、狗、猫、猴子、黑猩猩、仓鼠、兔子、牛和豚鼠(参见例如Kim等,(1997)MolReprod Dev 46515-526;Houdebine,(1995)Reprod Nutr Dev35609-617;Petters(1994)Reprod Fertil Dev 6643-645;Schnieke等,(1997)Science 2782130-2133;和Amoah,(1997)JAnimal Science 75578-585)。
将核酸片段引入能够重组的哺乳动物细胞的方法可以是任何利于进行多个核酸分子的共转化的方法。用于生产转基因动物的详细过程对于本技术领域的技术人员来说很容易获得,包括US专利号5,489,743和US专利号5,602,307所公开的内容。
L.诊断方法
技术领域:
本发明的基因和蛋白在胃癌细胞和其它恶性肿瘤细胞中的表达不同于在同类型的非癌性组织中的表达,因此本发明的基因和蛋白可以被用来诊断或监控这种癌或跟踪疾病的进程。一种利用本发明的核酸分子或蛋白诊断包括胃癌在内的癌症的手段涉及从活体如活检组织样本中获得组织。
分子生物学工具的利用已经成为常规的法医技术。例如,含有SEQID NO1,3,5,7,9,11,13或17所示序列的全长序列或至少部分序列的核酸探针可以被用来测定法医/病理样本中的核酸分子的表达。而且,核酸分析可以通过任何转录图谱分析手段来进行。除了核酸分析,本发明的法医方法可以指向本发明的蛋白,尤其是一种含SEQID NO2,4,6,8,10,12,14,16,18或20的蛋白,来确定基因的上调或下调(Shiverick等,(1975)Biochim Biophys Acta393124-133)。
本发明的方法可以包括利用胶原酶或其它蛋白酶进行的组织处理来使组织易于细胞溶解(Semenov等,(1987)Biull Eksp Biol Med104113-116)。而且,有可能从分析用的胃的不同区域获得活检组织样品。
检测本发明核酸或蛋白分子的试验可以是任何可利用的形式。用于核酸分子的常规测定方法包括杂交或基于PCR的方法。用于检测本发明的蛋白、多肽或肽的常规试验包括任何可利用形式的抗体探针的使用,如原位结合试验等(参见Harlow & Lane,Antibodies-ALaboratory Manual,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY,1988)。在一个优选的实施方案中,试验利用适当的对照来进行。
上述方法还可以被用于其它诊断方案,包括检测其它组织或器官的疾病状况的方案和方法,例如其中检测到表达本发明的核酸分子的组织。
无需再描述,确信本技术领域的普通技术人员能够利用前面的描述和下面的说明性实施例制备和利用本发明的化合物并实施所要求的方法。因此下面的实施例具体指出了本发明的优选实施方案。并且无论如何不应被解释为是对所公开的其余部分的限定。
实施例
实施例 1a
对晚期胃癌中差异表达的mRNA进行的鉴定
材料和方法
将患者组织样品从5名年龄在47-68岁的朝鲜患者(包括四名男性和一名女性)体内取出,所述朝鲜患者被诊断患有晚期胃癌。对于每名患者来说,从胃的两个区域中取得组织来制备一套活检组织样品,所述两个区域是胃肿瘤和非癌性区域。对每个组织样品进行组织学分析,并将样品分类成非癌类或癌类。
按照Affymetrix GeneChip Expression Analysis Manual(稍加改动)制备样品。首先利用Spex Certiprep 6800 Freezer Mil将冷冻组织研磨成粉末。然后利用Trizol(Life Technologies)提取总RNA。每个样品的总RNA产率(组织平均重量为300mg)是200-500μg。接着,利用Oligotex mRNA Midi试剂盒(Qiagen)分离mRNA。由于mRNA洗脱于终体积400μl中,因此需要通过乙醇沉淀步骤将浓度变到1μg/μl。利用1-5μg的mRNA,通过SuperScript Choice系统(Gibco-BRL)制备双链cDNA。采用T7-(dT24)寡核苷酸引发第一链cDNA链的合成。然后对cDNA进行酚-氯仿提取,并且进行乙醇沉淀直到终浓度为1μg/μl。
从2μg的cDNA,按照常规方法合成cRNA。为了对cRNA进行生物素标记,将核苷酸Bio-11-CTP和Bio-16-UTP(Enzo Diagnostics)加到反应物中。在37℃下温育6小时后,按照RNeasy Mini试剂盒方案(Qiagen)清理被标记的cRNA。然后在94℃下对cRNA进行35分钟的片段化(5×片段化缓冲液200mM Tris-醋酸盐(pH 8.1),500mMKOAc,150mM MgOAc)。
在45℃的杂交箱中以60rpm将55μg片段化的cRNA杂交到Affymetrix Human Genome装置U95和U133的阵列上,杂交进行24小时。冲洗芯片并在Affymetrix流体平台中用StreptavidinPhycoerythrin(SAPE)(Molecular Probes)对所述芯片进行染色。为了增强染色,两次加入SAPE溶液,在两次之间有一个抗-链霉亲和素生物素化抗体(Vector Laboratories)染色步骤。利用荧光测定扫描技术(Hewlett Packard Gene Array Scanner)检测探针阵列上的杂交。杂交和扫描后,对微阵列图像进行分析以进行质量控制,寻找出芯片的主要缺陷或杂交信号中的异常。当所有芯片通过QC后,利用Affymetrix Microarray Suite(v4.0)和LIMS(v1.5)分析U95的数据,或用Affymetrix Microarray Suite(v5.0)和LIMS(v3.0)分析U133的数据。
按照以下统计学方法,通过利用Affymetrix human GeneChip装置U95和U133来测定癌性或非癌性肝组织样品之间的基因差异性表达。(1)对于每种基因,Affymetrix GeneChip的U95平均差值通过利用Affymetrix Microarray Suite(v4.0)来测定,其中AffymetrixMicroarray Suite(v4.0)还针对每个GeneChip单元设定“Absent”(=未检测到),“Present”(=检测到的)或“Marginal”(=不能清楚地确定Absent或Present)这三个指征。U133的信号值通过AffymetrixMicroarray Suite(v5.0)来测定,Affymetrix Microarray Suite(v5.0)也设定了Absent、Present或Marginal这三个指征。(2)以癌性和非癌性肝组织样品中的至少10%Present指征以及癌性或非癌性肝组织样品组中的至少40%Present指征为标准,选择一组基因用于进一步分析。(3)基于U95数据的平均差值,将该组基因分成两组,一个高表达组和一个低表达组。高表达组含有在癌性和非癌性样品中平均差值大于或等于5的基因。其余的基因被包含在低表达组中。对于高表达组来说,平均差值被转化成对数值,而对于低表达组来说没有转化。对于U133数据,所有信号值都被转化为对数值,而不考虑表达水平。(4)Analysis of Variance(ANOVA)方法被用于数据分析(Steel等,Principles and Procedures of StatisticsA Biome tricalApproach,Third Ed.,McGraw-Hill,1997)。在进行最终分析前,排除法(leave-one-out)被用于外部(outlier)检测。ANOVA分析中每次排除一个样品来确定是否从分析中省略一个特定样品对最终结果具有显著影响。如果有影响,就从最终分析中排除那个特定样品。外部检测后,差异表达的p值小于或等于0.05的一列基因通过ANOVA来产生。来源于Affymetrix GeneChip U133芯片的数据也利用相似方法来分析。(5)另外两个标准被用来减少基因列表中的得自U95的基因数目。首先,比较非癌性对照组样品与癌症组样品之间的几何平均值从而获得一组表达水平提高或降低至少2倍的基因。其次,变化倍数值与p值的比例应该为400或更高。
结果与分析
a)LBFL301基因家族
芯片数据的分析结果表明胃癌样品与得自正常胃组织的样品相比,标记物LBFL301的表达明显上调了(13.75-倍;p=0.0172)。这些数据表明LBFL301的上调可以被用于胃癌的诊断。
LBFL301(SEQ ID NO1或3)的表达水平可以分别采用AffymetrixGeneChipsU95和U133,通过利用序号为48774_at和225681_at的芯片序列片段来测定。不同恶性肿瘤中的48774_at和225681_at相对于正常对照组织的表达水平见表1a,其中还显示了变化倍数和变化的趋势(上调或下调)。变化倍数大于1.5的被认为是显著的。
表1a Affy ID组织疾病形态学变化倍数趋势T-Stat 48774_at骨头,NOS恶性骨癌,NOS骨巨细胞瘤,NOS5.7上调3.5 225681_at乳房,NOS女性恶性乳腺癌,NOS浸润管癌3.4上调12.1 225681_at浸润管和小叶癌3.3上调3.3 225681_at浸润小叶癌2.8上调5.3 225681_at子 宫颈,NOS恶性子宫颈癌鳞状细胞癌,NOS3.6上调3.4 225681_at结肠,NOS恶性结肠癌,NOS粘液性腺癌12.7上调2.5 225681_at腺癌,NOS6.9上调7.9 225681_at子宫内膜,NOS恶性子宫内膜癌米勒混合瘤11.0上调5.5腺癌,NOS2.2上调3.7 225681_at食管,NOS恶性食管癌,NOS腺癌,NOS7.2上调3.6 225681_at肾,NOS恶性肾癌,NOS透明细胞腺癌,NOS9.8上调5.4 225681_at维耳姆斯氏瘤7.2上调3.4 225681_at喉,NOS恶性喉癌,NOS鳞状细胞瘤,NOS6.6上调4.3 225681_at肝脏,NOS继发性恶性肝癌,NOS腺癌,NOS12.4上调3.5 225681_at肺,NOS恶性肺癌,NOS鳞状细胞癌,NOS5.4上调5.4 225681_at腺癌,NOS4.4上调5.1 225681_at淋 巴结,NOS继发性恶性淋巴结癌,NOS鳞状细胞癌4.1上调2.7 225681_at恶性淋巴和组织细胞组织癌,NOS恶性淋巴瘤,NOS-4.3下调-3.2 225681_at网膜,NOS恶性网膜癌乳头状浆液腺癌7.2上调4.1 225681_at继发性恶性网膜癌乳头状浆液腺癌4.8上调4.3 225681_at米勒混合瘤4.7上调11.0 225681_at卵恶性卵巢癌腺癌,NOS13.8上调2.6
225681_at 巢,NOS 浆液囊细胞腺癌, NOS 10.7 上调 2.8 225681_at 卵巢不明性质 的癌 卵巢甲状腺肿样 瘤 9.5 上调 6.4 225681_at 恶性卵巢癌 乳头状浆液腺瘤 7.7 上调 3.7 225681_at 继发性恶性卵 巢癌 腺癌,NOS 6.9 上调 3.7 225681_at 卵巢不明性质 的癌 浆液囊细胞腺癌, 边缘癌 5.3 上调 7.2 225681_at 胰 腺,NOS 恶性胰腺 癌,NOS 腺癌,NOS 7.8 上调 9.3 225681_at 直 肠,NOS 恶性直肠癌 腺癌,NOS 7.7 上调 5.8 225681_at 软 组 织,NOS 结缔组织和其 它软组织不明 性质的肿 瘤,NOS 纤维瘤 12.5 上调 7.6 225681_at 结缔组织和其 它软组织的继 地性恶性 病,NOS 鳞状细胞癌,NOS 5.3 上调 3.2 225681_at 结缔组织和其 它软组织的恶 性病,NOS 纤维组织细胞瘤, 恶性 3.7 上调 3.1 225681_at 胃,NOS 恶性胃癌,NOS 腺癌,NOS 3.6 上调 3.5 225681_at 印戒细胞癌 3.5 上调 4.5 225681_at 甲 状 腺NOS 恶性甲状腺癌 乳头状瘤,NOS 4.5 上调 4.1
表2列出了从利用Affymetrix GeneChip的实验中收集的组织类型差异表达数据。对芯片进行扫描并利用相关专利申请60/331,182,60/388,745和60/390,608中记载的GX Scan算法对数据进行分析,其中所述专利申请的题目全部是“用于组织和采集得自具有综合临床特性的生物样品的基因表达数据的基于自动化计算机的数据处理法(An Automated Computer-based Algorithm for Organizing andMining Gene Expression Data Derived from Biological Sampleswith Complex Clinical Attributes)”,而且其全部内容被引入本文作参考。
表2-LBFL301(U9548774_at,U133225681_at)克隆AD12 & CH4
源自U95数据的48774_at 源自U133数据的225681_at
1.骨 升高 —
2.乳房 升高 升高
3.子宫颈 升高 升高
4.结肠 升高 升高
5.子宫内膜 升高 升高
6.食道 升高 升高
7.肾 升高 升高
8.喉 升高 升高
9.肝脏 升高 升高
10.肺升高 升高
11.网膜 升高 升高
12.卵巢 升高 升高
13.胰腺 升高 升高
14.直肠 升高 升高
15.软组织升高 升高
16.胃升高 升高
17.甲状腺升高 升高
通过使样品与芯片序列片段48774_at结合测定到的GeneChip表达结果由利用Taqman检测物(Perkin-Elmer)的定量RT-PCR得到证实。在测定中使用了由特定的Affymetrix片段(48774_at)的sif序列设计的PCR引物。每个RNA样品(10ng的总RNA)中的靶基因相对于外源性掺入(spike)的参比基因进行分析。出于这一目的,四环素抗性基因被用作外源添加的掺入物。该方法提供了通过由靶mRNA的循环阈值(cycle threshold)(Ct)相对于恒定的Tet掺入物的Ct值测定的相对表达。样品组包括用U95 GeneChip测定的正常胃组织和晚期胃癌组织RNA。另外,没有用GeneChip分析的几个新样品被用于定量RT-PCR中以对表达进行验证。Q-RT-PCR数据证实了晚期胃癌中观察到的LBFL301的上调。
b)LBFL304基因家族
芯片数据的分析表明AGC样品中的标记物LBFL304的表达与得自正常胃组织的样品中的标记物LBFL304的表达相比被明显地上调了(对于U95为3.5-倍,p=2.54×10-3;对于U133为6.13-倍,p=2.43×10-4)。该数据表明LBFL304的上调可被用于胃癌的诊断。
LBFL304(SEQ ID NO5,7,9或11)的表达水平可以通过利用Affymetrix GeneChipsU95上的序号为35832_at的芯片序列片段和利用Affymetrix GeneChipsU133上的序号为212344_at,212353_at和212354的芯片序列片段来测定。相对于正常对照组织,各种恶性肿瘤中的51263_at,212344_at,212353_at,和212354_at的表达水平被列于表1b,其中还显示了变化倍数和变化趋势(上调或下调)。变化倍数大于1.5的被认为是显著的。
通过使样品结合到序号为35832_at的芯片序列片段而测定的GeneChip表达结果通过利用Taqman分析法(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)得到了验证。由特定Affymetrix片段(35832_at)的序列信息文件设计的PCR引物被用于分析当中。相对于外源加入的参比基因,检测了每一RNA样品(10ng总RNA)中的目标基因。为了这个目的,将四环素抗性基因用作外源添加的掺入物。该方法提供了通过由靶mRNA的循环阈值(Ct)相对于恒定量的Tet掺入物的Ct而测定的相对表达。样品组包括用U95 GeneChip测定的正常胃(Normal)组织和晚期胃癌(AGC)组织RNA。另外,没有用GeneChip分析的几个新样品被用于通过Q-RT-PCR对表达进行验证。相对于正常胃活检组织样品,Q-RT-PCR数据证实了AGC中观察到的LBFL304的上调。
表1b 表1 Affy ID组织疾病形态学变化倍数趋势T-Stat 212344_at骨头,NOS恶性骨癌,NOS骨巨细胞瘤,NOS6.8上调6.9 212353_at恶性骨癌,NOS骨巨细胞瘤,NOS5.5上调5.7 212354_at恶性骨癌,NOS骨巨细胞瘤,NOS5.9上调7.1 35832_at恶性骨癌,NOS骨巨细胞瘤,NOS10.6上调5.7 212344_at结肠,NOS恶性结肠癌,NOS粘液性腺癌3.7上调2.8 212344_at恶性结肠癌,NOS腺癌,NOS2.7上调7.9 212353_at恶性结肠癌,NOS粘液性腺癌5.7上调3.7 212353_at恶性结肠癌,NOS腺癌,NOS4.1上调9.0 212354_at恶性结肠癌,NOS粘液性腺癌4.7上调3.5 212354_at恶性结肠癌,NOS腺癌,NOS3.0上调8.6 35832_at恶性结肠癌,NOS粘液性腺癌9.4上调3.8 35832_at恶性结肠癌,NOS腺癌,NOS6.5上调10.2
表1b表1 Affy ID组织疾病形态学变化倍数趋势T-Stat 212344_at软 组织,NOS结缔组织和其它软组织恶性癌,NOS纤维组织细胞癌,恶性的2.7上调3.2 212353_at结缔组织和其它软组织恶性癌,NOS纤维组织细胞癌,恶性的2.1上调2.2 212353_at结缔组织和其它软组织恶性癌,NOS粘液样脂肉瘤-2.7下调-2.4 212354_at结缔组织和其它软组织恶性癌,NOS纤维组织细胞瘤,恶性的2.2上调2.6 35832_at结缔组织和其它软组织恶性癌,NOS纤维组织细胞瘤,恶性的3.5上调2.6 35822_at结缔组织和其它软组织恶性癌,NOS脂肪肉瘤,NOS4.8上调2.6 212344_at子宫内膜,NOS恶性子宫内膜癌米勒混合瘤2.4上调3.3 212344_at恶性子宫内膜癌腺癌,NOS2.2上调5.5 212353_at恶性子宫内膜癌米勒混合瘤1.9上调2.9 212353_at恶性子宫内膜癌腺癌,NOS2.0上调4.2 212354_at恶性子宫内膜癌米勒混合瘤2.0上调2.7 212354_at恶性子宫内膜癌腺癌,NOS1.9上调4.7 35832_at恶性子宫内膜癌米勒混合瘤3.0上调3.9 35832_at恶性子宫内膜癌腺癌,NOS2.4上调4.7 212344_at食管,NOS恶性食管癌,NOS腺癌,NOS1.7上调2.3 212353_at恶性食管癌,NOS腺癌,NOS5.5上调3.2 212354_at恶性食管癌,NOS腺癌,NOS2.9上调3.1 35832_at恶性食管癌,NOS腺癌,NOS10.7上调3.2
212344_at 乳房 ,NOS 女性恶性乳腺 癌,NOS 粘液性腺癌 3.3 上调 4.8 212344_at 女性恶性乳腺 癌,NOS 浸润小叶癌 1.6 上调 2.9 212344_at 女性恶性乳腺 癌,NOS 浸润管癌 2.5 上调 8.7 212344_at 女性恶性乳腺 癌,NOS 浸润管和小叶 癌 2.6 上调 2.8 212353_at 女性恶性乳腺 癌,NOS 浸润小叶癌 2.8 上调 4.7 212354_at 女性恶性乳腺 癌,NOS 浸润管癌 3.9 上调 13.0 212353_at 女性恶性乳腺 癌,NOS 浸润管和小叶 癌 3.4 上调 3.7 212354_at 女性恶性乳腺 癌,NOS 浸润小叶癌 1.7 上调 3.1 212354_at 女性恶性乳腺 癌,NOS 浸润管癌 2.6 上调 8.5 212354_at 女性恶性乳腺 癌,NOS 浸润管和小叶 癌 2.7 上调 2.6 35832_at 女性恶性乳腺 癌,NOS 粘液性腺癌 4.0 上调 5.5 35832_at 女性恶性乳腺 癌,NOS 浸润小叶癌 3.2 上调 4.4 35832_at 女性恶性乳腺 癌,NOS 浸润管癌 4.5 上调 12.0 35832_at 女性恶性乳腺 癌,NOS 浸润管和小叶 癌 4.3 上调 4.5 212353_at 肾,NOS 恶性肾癌,NOS 透明细胞腺 癌,NOS 2.8 上调 5.5 212354_at 恶性肾癌,NOS 透明细胞腺 癌,NOS 2.4 上调 5.3 35832_at 恶性肾癌,NOS 透明细胞腺 癌,NOS 6.1 上调 5.6
212344_at 喉,NOS 恶性喉癌,NOS 鳞状细胞腺 癌,NOS 3.0 上调 3.3 212353_at 恶性喉癌,NOS 鳞状细胞 癌,NOS 5.1 上调 3.8 212354_at 恶性喉癌,NOS 鳞状细胞 癌,NOS 3.7 上调 3.6 35832_at 恶性喉癌,NOS 鳞状细胞 癌,NOS 7.2 上调 3.7 212344_at 肺,NOS 恶性肺癌,NOS 癌,NOS 4.1 上调 3.9 212344_at 恶性肺癌,NOS 鳞状细胞 癌,NOS 3.1 上调 5.8 212344_at 恶性肺癌,NOS 巨细胞癌,NOS 2.7 上调 2.5 212344_at 恶性肺癌,NOS 腺癌,NOS 2.8 上调 6.2 212353_at 恶性肺癌,NOS 癌,NOS 4.1 上调 3.2 212353_at 恶性肺癌,NOS 鳞状细胞 癌,NOS 3.6 上调 6.5 212353_at 恶性肺癌,NOS 巨细胞癌,NOS 3.8 上调 2.7 212353_at 恶性肺癌,NOS 腺癌,NOS 3.6 上调 6.9 212354_at 恶性肺癌,NOS 癌,NOS 3.5 上调 2.9 212354_at 恶性肺癌,NOS 鳞状细胞 癌,NOS 3.1 上调 5.6 212354_at 恶性肺癌,NOS 巨细胞癌,NOS 2.9 上调 2.6 212354_at 恶性肺癌,NOS 腺癌,NOS 2.9 上调 6.2 35832_at 恶性肺癌,NOS 鳞状细胞 癌,NOS 8.8 上调 6.0 35832_at 恶性肺癌,NOS 腺癌,NOS 8.9 上调 7.2 212344_at 卵 巢,NOS 恶性卵巢癌 乳头状浆液腺 癌 3.0 上调 3.9 212353_at 恶性卵巢癌 乳头状浆液腺 癌 3.6 上调 3.9 212354_at 恶性卵巢癌 乳头状浆液腺 癌 2.6 上调 3.4 212344_at 胰 腺,NOS 恶性胰腺癌,NOS 腺癌,NOS 6.9 上调 9.0 212353_at 恶性胰腺癌,NOS 腺癌,NOS 7.8 上调 11.2 212354_at 恶性胰腺癌,NOS 腺癌,NOS 8.6 上调 11.0
35832_at 恶性胰腺癌,NOS 腺癌,NOS 99.8 上调 11.1 212353_at 前列 腺,NOS 恶性前列腺癌 非典型疑似恶 性 -2.2 下调 -4.7 212353_at 恶性前列腺癌 腺癌,NOS -1.5 下调 -2.5 212354_at 恶性前列腺癌 非典型疑似恶 性 -1.8 下调 -3.8 212354_at 恶性前列腺癌 腺癌,NOS -1.7 下调 -3.8 35832_at 恶性前列腺癌 非典型疑似恶 性 -4.3 下调 -4.4 35832_at 恶性前列腺癌 腺癌,NOS -1.7 下调 -2.6 212344_at 直 肠,NOS 恶性直肠癌 腺癌,NOS 3.0 上调 6.9 212353_at 恶性直肠癌 腺癌,NOS 4.1 上调 7.6 212354_at 恶性直肠癌 腺癌,NOS 3.0 上调 7.2 35832_at 恶性直肠癌 腺癌,NOS 5.4 上调 8.8 212344_at 皮 肤,NOS 恶性皮肤癌,NOS 鳞状细胞 癌,NOS 2.8 上调 2.4 212353_at 恶性皮肤癌,NOS 鳞状细胞 癌,NOS 3.5 上调 2.4 35832_at 恶性皮肤癌,NOS 基底细胞 癌,NOS 3.6 上调 2.5 35832_at 恶性皮肤癌,NOS 鳞状细胞 癌,NOS 5.5 上调 3.0 212344_at 胃,NOS 恶性胃癌,NOS 粘液性腺癌 7.6 上调 3.1 212344_at 恶性胃癌,NOS 印戒细胞癌 3.9 上调 2.4 212344_at 恶性胃癌,NOS 腺癌,NOS 2.5 上调 4.9 212353_at 恶性胃癌,NOS 粘液性腺癌 11.0 上调 3.7 212353_at 恶性胃癌,NOS 印戒细胞癌 4.9 上调 2.9 212353_at 恶性胃癌,NOS 腺癌,NOS 3.4 上调 5.6 212354_at 恶性胃癌,NOS 粘液性腺癌 7.5 上调 3.2 212354_at 恶性胃癌,NOS 印戒细胞癌 3.7 上调 2.4 212354_at 恶性胃癌,NOS 腺癌,NOS 2.7 上调 5.1 35832_at 恶性胃癌,NOS 印戒细胞癌 8.4 上调 3.4 35832_at 恶性胃癌,NOS 腺癌,NOS 8.6 上调 6.7 212344_at 睾 丸,NOS 恶性睾丸癌,NOS 混合型生殖细 胞瘤 2.0 上调 2.4
212353_at 恶性睾丸癌,NOS 混合型生殖细 胞瘤 4.1 上调 2.8 212354_at 恶性睾丸癌,NOS 混合型生殖细 胞瘤 3.4 上调 2.6 212353_at 网 膜,NOS 恶性网膜癌 乳头状浆液腺 癌 1.7 上调 2.6 35832_at 甲 状 腺,NOS 恶性甲状腺癌 乳头状瘤,NOS 2.5 上调 2.5 35832_at 子 宫 颈,NOS 恶性子宫颈癌 鳞状细胞 癌,NOS 3.5 上调 2.3
c)LBFL305基因家族
芯片数据的分析表明胃癌样品中的标记物LBFL305的表达与得自正常胃组织的样品中的标记物LBFL305的表达相比被明显地上调了(2.2-倍,p=0.0051,利用U95 GeneChip;2.14-倍,p=0.0109,利用U133 GeneChip)。该数据表明LBFL305的上调可被用于胃癌的诊断。
LBFL305(SEQ ID NO13)的表达水平可以通过分别利用AffymetrixGeneChipsU95和U133上的序号为53858_at和225364_at的芯片序列来测定。从利用Affymetrix GeneChips的实验收集通过组织类型进行差异表达的数据并利用GX Scan算法对这些数据进行分析,GXScan算法被记载在相关专利申请60/331,182,60/388,745和60/390,608中,其中所述专利申请的题目全部是“用于组织和采集得自具有综合临床特性的生物样品的基因表达数据的基于自动化计算机的数据处理法(An Automated Computer-based Algorithm forOrganizing and Mining Gene Expression Data Derived fromBiological Samples with Complex Clinical Attributes)”,而且其全部内容被引入本文作参考。相对于正常对照组织,各种恶性肿瘤中的53858_at和225364_at的表达水平被列于表1c,其中还显示了变化倍数和变化趋势(上调或下调)。变化倍数大于1.5的被认为是显著的。
表1c Affy ID组织疾病形态学 变化 倍数趋势T-Stat 53858_at膀胱,NOS女性恶性膀胱癌,NOS过渡细胞癌,NOS 1.691上调2.377 53858_at乳房,NOS女性恶性乳腺癌,NOS浸润管癌 1.538上调6.824 53858_at女性恶性乳腺癌,NOS浸润管和小叶癌 1.599上调2.408 225364_at女性恶性乳腺癌,NOS浸润管和小叶癌 1.525上调3.251 53858_at子宫颈,NOS恶性子宫颈癌鳞状细胞癌,NOS 1.637上调4.056 53858_at子宫内膜,NOS恶性子宫内膜癌米勒混合瘤 1.548上调2.647 53858_at食管,NOS恶性食管癌,NOS腺癌,NOS 2.079上调3.145 225364_at恶性食管癌,NOS腺癌,NOS 1.615上调2.915 53858_at肾,NOS恶性肾癌,NOS肾细胞癌 1.864上调6.093 53858_at恶性肾癌,NOS透明细胞腺癌,NOS 2.167上调6.877 225364_at恶性肾癌,NOS肾细胞癌 1.593上调5.045 225364_at恶性肾癌,NOS透明细胞腺癌,NOS 1.683上调7.924 225364_at肺,NOS恶性肺癌,NOS小细胞癌,NOS -1.79下调-7.071 53858_at淋巴结,NOS何杰金氏病,多位点淋巴结的NOS何杰金氏病,NOS 1.539上调2.519 53858_at恶性淋巴和组织细胞组织瘤恶性淋巴癌,NOS 1.635上调3.243 53858_at胰腺,NOS恶性胰岛癌岛细胞癌 3.845上调7.929 53858_at恶性胰腺癌,NOS腺癌,NOS 4.171上调7.165 225364_at恶性胰岛癌岛细胞癌 2.343上调3.551 225364_at恶性胰腺癌,NOS腺癌,NOS 2.278上调10.793 225364_at前列腺,NOS恶性前列腺癌非典型疑性恶性 -1.641下调-4.8 53858_at直肠,NOS恶性直肠癌腺癌,NOS 1.935上调5.416
53858_at小肠,NOS恶性淋巴癌,未确定的,结节外的或实体器官位点的NOS恶性淋巴癌,NOS 3.935上调3.535 225364_at恶性淋巴癌,未确定的,结节外的或实体器官位点的NOS恶性淋巴癌,NOS 3.024上调3.816 53858_at胃,NOS恶性胃癌,NOS印戒细胞癌 1.507上调2.46 53858_at恶性胃癌,NOS腺癌,NOS 2.076上调5.928 225364_at恶性胃癌,NOS印戒细胞癌 1.524上调3.076 225364_at恶性胃癌,NOS腺癌,NOS 1.637上调6.053 225364_at甲状腺,NOS恶性淋巴癌,未确定的,结节外的或实体器官位点的NOS恶性淋巴癌,NOS 4.371上调9.429 225364_at恶性甲状腺癌乳头状癌,NOS 1.634上调3.22 53858_at女阴,NOS恶性女阴癌,NOS鳞状细胞癌,NOS 1.505上调2.596
通过使样品结合到序号为53858_at的芯片序列片段而测定的GeneChip表达结果通过利用Taqman分析法(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)得到了验证。由特定Affymetrix片段(53858_at)的序列信息文件设计的PCR引物被用于分析当中。每个RNA样品(10ng的总RNA)中的靶基因相对于外源掺入的参比基因进行分析。出于这一目的,四环素抗性基因被用作外源添加的掺入物。该方法提供了通过由靶mRNA的循环阈值(Ct)相对于恒定量的Tet掺入物的Ct而测定的相对表达。样品组包括用U95 GeneChip测定的正常胃组织和晚期胃癌组织RNA。另外,没有用GeneChip分析的几个新样品被用于通过定量RT-PCR对表达进行的验证。Q-RT-PCR数据证实了晚期胃癌中观察到的LBFL305的上调。
d)LBFL306基因家族
芯片数据的分析表明胃癌样品中的标记物LBFL306的表达与得自正常胃组织的样品中的标记物LBFL306的表达相比被明显地上调了(3.27-倍,p=0.00217,利用U133 GeneChip)。该数据表明LBFL306的上调可被用于胃癌的诊断。
LBFL306(SEQ ID NO17,19或21)的表达水平可以通过分别利用Affymetrix GeneChipsU95和U133上的序号为57861_at和223251_s_at的芯片序列片段来测定。从利用Affymetrix GeneChips的实验收集通过组织类型进行差异表达的数据并利用GX Scan算法对这些数据进行分析,GX Scan算法被记载在相关专利申请60/331,182,60/388,745和60/390,608中,其中所述专利申请的题目全部是“用于组织和采集得自具有综合临床特性的生物样品的基因表达数据的基于自动化计算机的数据处理法(An Automated Computer-basedAlgorithm for Organizing and Mining Gene Expression DataDerived from Biological Samples with Complex ClinicalAttributes)”,而且其全部内容被引入本文作为参考。相对于正常对照组织,各种恶性肿瘤中的223251_at的表达水平被列于表1d,其中还显示了变化倍数和变化趋势(上调或下调)。变化倍数大于1.5的被认为是显著的。所述数据表明除了胃癌外,膀胱癌、结肠癌、食道癌、肾癌、网膜癌、胰腺癌、直肠癌和软组织癌中的LBFL306的表达也被上调了,并且这种基因家族的表达在乳腺癌、子宫内膜癌和小肠癌中被下调了。
序列为SEQ ID NO17或19或21的全长cDNA通过利用GeneTrappercDNA Positive Selection System Kits(Invitrogen)而获得。所获得的cDNA被转化成双链质粒DNA,该双链质粒DNA被用于转化大肠杆菌细胞(DH10B),并筛选出最长的cDNA。通过利用基因-特异性引物由PCR证实了阳性筛选后,对cDNA克隆进行DNA测序。
进行RNA印迹分析来测定对应于LBFL306的mRNA转录物大小。使用了含有得自各种人组织的总RNA的RNA印迹物(ClonTech H12),并且通过随机引物法对LBFL306-GE2(SEQ ID NO21)进行放射性标记后用于探测印迹物。这些印迹物在65℃下于Church和Gilbert缓冲液中进行杂交并在室温下用含0.1%SDS的0.1×SSC冲洗。RNA印迹显示了该基因的具有约1.5kb大小的单一转录物。这对应于全长克隆中的插入物的大小,其也为约1.5kb。
通过使样品结合到序号为223251_s_at的芯片序列片段而测定的GeneChip表达结果通过利用Taqman分析法(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)得到了验证。由特定Affymetrix片段(223251_s_at)的序列信息文件设计的PCR引物被用于分析中。每个RNA样品(10ng的总RNA)中的靶基因相对于外源掺入的参比基因进行分析。出于这一目的,四环素抗性基因被用作外源添加的掺入物。该方法提供了通过由靶mRNA的循环阈值(Ct)相对于恒定量的Tet掺入物的Ct而测定的相对表达。样品组包括用U133 GeneChip测定的正常胃组织和晚期胃癌组织RNA。另外,没有用GeneChip分析的几个新样品被用于通过Q-RT-PCR对表达进行的验证。Q-RT-PCR数据证实了晚期胃癌中观察到的LBFL306的上调。
表1d 芯片位置号组织疾病形态学变化倍数趋势T-Stat 223251_s_at膀胱,NOS膀胱恶性肿瘤,NOS过渡细胞癌,NOS1.649上调2.572 223251_s_at乳房,NOS女性乳腺恶性肿瘤,NOS管内癌,NOS-1.701下调-5.202 223251_s_at结肠,NOS结肠恶性肿瘤,NOS腺癌,NOS2.651上调8.164 223251_s_at子宫内膜,NOS子宫内膜恶性肿瘤米勒混合肿瘤-1.806下调-2.367 223251_s_at食道,NOS食管恶性肿瘤,NOS腺癌,NOS5.016上调4.269 223251_s_at肾,NOS肾恶性肿瘤,NOS过渡细胞癌,NOS1.755上调4.563 223251_s_at肾恶性肿瘤,NOS透明细胞腺癌,NOS1.611上调4.054 223251_s_at肾恶性肿瘤,NOS Wilm′s肿瘤4.565上调3.891 223251_s_at网膜,NOS网膜恶性肿瘤乳头状浆液腺癌1.762上调3.398 223251s_at胰腺,NOS胰腺恶性肿瘤,NOS腺癌,NOS2.672上调7.13 223251_s_at直肠,NOS直肠恶性肿瘤腺癌,NOS2.482上调6.042 223251_s_at小肠,NOS小肠恶性肿瘤,NOS肉瘤,NOS-1.944下调-5.716
223251_s_at软组织,NOS结缔组织和其它软组织的恶性肿瘤,NOS粘液性脂肉瘤 1.878上调3.894 223251_s_at胃,NOS胃恶性肿瘤,NOS腺癌,NOS 2.522上调5.101
实施例2
对应于差异表达的mRNA品种的全长人cDNA(LBFL301,LBFL304,LBFL305和LBFL306)的克隆
通过寡核苷酸-牵引(oligo-pulling)法获得序列为SEQ ID NO1,3,5,7,9,11,13,17,19或21的全长cDNA。简要地说,在LBFL301,LBFL304,LBFL305或LBFL306的序列基础上设计基因-特异性寡核苷酸。该寡核苷酸被标记上生物素后按照Sambrook等的方法与2μg的单链质粒DNA(cDNA重组体)进行杂交,其中所述单链质粒DNA得自完全分化的胃腺癌文库(NCI CGAP Gas 4)或由Jurkat细胞制备的文库。利用结合了链霉亲和素的珠子分离所述杂交cDNA并通过加热洗脱。洗脱下来的cDNA被转化成双链质粒DNA并被用于转化大肠杆菌细胞(DH10B),筛选出最长的cDNA。利用基因-特异性引物证实阳性筛选后,对所述cDNA克隆进行DNA测序。
对应于以上检测的差异调控的mRNA的全长人cDNA的核苷酸序列如SEQ ID NOS1,3,5,7,9,11,13,17,19和21所示。在SEQID NO 1中,所述cDNA含1272个碱基对(1255个碱基对和一个多聚腺苷酸尾)。在SEQ ID NO 3中,cDNA含1355个碱基对(1334个碱基对和一个多聚腺苷酸尾)。LBFL304具有几个可能的启动密码子,并且它们被命名为SEQ ID NOS5,7,9和11。SEQ ID NO13中的cDNA含6405个碱基对(6369个碱基对和一个多聚腺苷酸尾)。与SEQ IDNO17对应的cDNA含1299个碱基对(1284个碱基对和一个多聚腺苷酸尾)。与SEQ ID NO19对应的cDNA含2451个碱基对(2435个碱基对和一个多聚腺苷酸尾)。与SEQ ID NO21对应的cDNA含1194个碱基对(1178个碱基对和一个多聚腺苷酸尾)。
SEQ ID NO1所示的cDNA核苷酸序列内的可读框位于第131-859位核苷酸(131-862位含终止密码子),编码243个氨基酸的蛋白。对应于由SEQ ID NO1编码的预测蛋白的氨基酸序列如SEQ ID NO2所示。
SEQ ID NO3所示的cDNA核苷酸序列内的可读框位于第174-584位核苷酸(174-587位含终止密码子),编码137个氨基酸的蛋白。对应于由SEQ ID NO3编码的预测蛋白的氨基酸序列如SEQ ID NO4所示。SEQ ID NO4的蛋白序列与SEQ ID NO2的蛋白序列在前124个氨基酸上相同,而SEQ ID NO4的最后13个氨基酸是独特的。如图1所示,与SEQ ID NO4对应的蛋白序列的终端是由45-bp插入子产生,所述插入子在可读框中引进了终止密码子。
SEQ ID NO2和4稍微类似于胰凝乳蛋白酶丝氨酸蛋白酶家族基序(signature)(S1)和NUDIX水解酶家族基序。胰凝乳蛋白酶丝氨酸蛋白酶家族基序(S1)含有三个区域,第三个区域不存在于SEQ ID NO4中。另外,两种蛋白都含有胶原三螺旋重复区域。
图2和3表示对SEQ ID NO2和4的氨基酸序列的疏水性进行分析的结果。如上所述,亲水性区域可被用来制备抗原肽。两个序列都具有疏水性的N-端,约30个氨基酸长度,最强疏水性部分集中在第20位氨基酸的附近。由SPScan(GCG Wisconsin Package)进行的进一步的蛋白序列分析展示出由1-30位氨基酸形成的疏水区域似乎就是分泌信号肽。
SEQ ID NO5所示的cDNA核苷酸序列内的可读框位于第38-892位核苷酸(38-895位含终止密码子),编码285个氨基酸的蛋白。对应于由SEQ ID NO5编码的预测蛋白的氨基酸序列如SEQ ID NO6所示。SEQ ID NO6稍微类似于胰凝乳蛋白酶丝氨酸蛋白酶家族基序(S1)。图4表示对SEQ ID NO6的氨基酸序列的疏水性进行分析的结果。如上所述,亲水性区域可被用来制备抗原肽。
SEQ ID NO7所示的cDNA核苷酸序列内的可读框位于第53-892位核苷酸(53-895位含终止密码子),编码280个氨基酸的蛋白。对应于由SEQ ID NO7编码的预测蛋白的氨基酸序列如SEQ ID NO8所示。SEQ ID NO8的蛋白序列与SEQ ID NO6的蛋白序列相同, 但是SEQ ID NO8缺乏SEQ ID NO6的N-端的头五个氨基酸。
SEQ ID NO9所示的cDNA核苷酸序列内的可读框位于第65-892位核苷酸(65-895位含终止密码子),编码276个氨基酸的蛋白。对应于由SEQ ID NO9编码的预测蛋白的氨基酸序列如SEQ ID NO10所示。SEQ ID NO10的蛋白序列与SEQ ID NO6的蛋白序列相同,但是SEQ ID NO10缺乏SEQ ID NO6的N-端的头九个氨基酸。
SEQ ID NO11所示的cDNA核苷酸序列内的可读框位于第92-892位核苷酸(92-895位含终止密码子),编码267个氨基酸的蛋白。对应于由SEQ ID NO11编码的预测蛋白的氨基酸序列如SEQ ID NO12所示。SEQ ID NO12的蛋白序列与SEQ ID NO6的蛋白序列相同,但是SEQ ID NO12缺乏SEQ ID NO6的N-端的头18个氨基酸。
SEQ ID NO13所示的cDNA核苷酸序列内的可读框位于第49-1434位核苷酸(49-1437位含终止密码子),编码462个氨基酸的蛋白。对应于由SEQ ID NO13编码的蛋白的氨基酸序列如SEQ ID NO14所示。
BLAST检索结果和两个序列间的高度同源性表明LBFL305是Mst1的(例如,SEQ ID NO16的)剪接变体。比对序列的下划线氨基酸残基表示SEQ ID NO14与SEQ ID NO18之间的差异。基于Mst1的公开的研究,SEQ ID NO14含有激酶区域(氨基酸位点1-299)(Creasy等,(1996)J Biol Chem 27121049-21053),接下来的是调节激酶功能的调控区域(氨基酸位点300-462)(Creasy等,(1996)JBiol Chem 27121049-21053)。在氨基酸位点326-327与349-350之间(Graves等,(2001)J Biol Chem 27614909-14915)还存在两个caspase裂解位点,和一个NES域(氨基酸位点361-370)(Ura等,(2002)Proc Nat1 Acad Sci USA 9810148-10153)。与SEQ ID NO16相比,SEQ ID NO14缺失了第二个NES域(SEQ ID NO16中的氨基酸位点441-451)(Ura等,(2002)Proc Nat1 Acad Sci USA 9810148-10153)。而且,SEQ ID NO14不含自身缔合所需的多聚化区域(Mst1中的氨基酸位点431-4871)(Creasy等,(1996)J Biol Chem27121049-21053)。有趣地是,与NORE(一种假设的Ras效应物)发生相互作用所需的Mst1中的区域(SEQ ID NO16中的氨基酸位点449-487)(Khokh1atchev等,Curr Biol 12253-265)不存在于SEQ IDNO14中。
图5表示对SEQ ID NO14所示氨基酸序列进行疏水性分析的结果。如上所述,亲水区域可以被用来制备抗原肽。
SEQ ID NO17所示的cDNA核苷酸序列内的可读框位于第75-572位核苷酸(75-575位含终止密码子),编码166个氨基酸的蛋白。对应于由SEQ ID NO17编码的蛋白的氨基酸序列如SEQ ID NO18所示。图7表示对SEQ ID NO18所示氨基酸序列进行疏水性分析的结果。如上所述,亲水区域可以被用来制备抗原肽。
SEQ ID NO19所示的cDNA核苷酸序列内的可读框位于第78-1337位核苷酸(78-1340位含终止密码子),编码420个氨基酸的蛋白。对应于由SEQ ID NO19编码的蛋白的氨基酸序列如SEQ ID NO20所示。图8表示对SEQ ID NO20所示氨基酸序列进行疏水性分析的结果。如上所述,亲水区域可以被用来制备抗原肽。
SEQ ID NO21所示的cDNA核苷酸序列内的可读框位于第78-737位核苷酸(78-740位含终止密码子),编码220个氨基酸的蛋白。对应于由SEQ ID NO21编码的蛋白的氨基酸序列如SEQ ID NO22所示。图9表示对SEQ ID NO22所示氨基酸序列进行疏水性分析的结果。如上所述,亲水区域可以被用来制备抗原肽。
利用GCG Wisconsin软件包通过hmmerpfam确定全部三个LBFL306克隆,即EF3(SEQ ID NO17),GC7(SEQ ID NO19)和GE2(SEQ ID NO21)都含多个锚蛋白重复序列。所述锚蛋白重复序列是从EF3,GC7和GE2中的氨基酸残基57至89,91至123和124至156。除了这三个锚蛋白重复序列,GC7还含从157至190的另一个锚蛋白重复子。
通过进行RNA印迹分析来确定对应于LBFL301,LBFL304和LBFL305的mRNA转录物的大小。采用含有源自各种人体组织的总RNA的RNA印迹物(ClonTech),而且克隆CH4(SEQ ID NO3)、克隆EA10(SEQ ID NO5,7,9或11)和LBFL305(SEQ ID NO13)通过随机引物法被放射性标记后用于探测所述印迹物。所述印迹物在65℃下于Church和Gilbert缓冲液中进行杂交,然后在室温下用含0.1%SDS的0.1×SSC缓冲液冲洗。RNA印迹分析结果显示了每个基因的单个转录物,大小约为1.57kb(LBFL301),2.6kb(LBFL304)和7.95kb(LBFL305)。这与克隆CH4(1.355kb),克隆EA10(SEQID NO5,7,9或11)和LBFL305(6.5kb)中的插入物大小相对应。当克隆AD12(SEQ ID NO1)的序列被用作探针时,检测到了1.44kb的转录物,其对应于克隆AD12中插入物的大小,即1.272kb。
为了检测各种正常组织中的LBFL301,LBFL304,LBFL305或LBFL306的表达,按照以下方法制备电子RNA印迹(e-Northern)。利用实施例1中的芯片和方法,将如表3中所示的得自一组正常组织的mRNA杂交到Affymetrix U95 human GeneChip上。这些实验的结果被列于表3中。针对每种组织类型,被注明有或无的样品数目与样品组中样品的总数目一起列了出来。另外,列出了每种组织类型中的中值和25%和75%的点。有趣地是,尽管该基因在胃癌中是上调的,但是在大多数正常胃组织样品中没能检测到LBFL301或LBFL304的表达。另外,尽管在检测的大多数正常胃组织样品中发现了LBFL305和LBFL306,但是表达水平比大多数其它被检测的正常胃组织中的表达水平低。如下所述,这种观察结果表明LBFL301,LBFL304,LBFL305或LBFL306可被用作诊断试剂或标记物以检测或筛选胃癌。LBFL301的表达水平似乎在皮肤组织中最高,其次是胎盘、动物脂肪、动脉、膀胱、骨头、乳房和软组织。尽管在肝脏或大脑和心脏的大部分区域中没有检测到该基因,但是在表3a中列出的其它大多数组织中检测到了较低水平的表达。LBFL304的表达水平似乎在动脉、网膜、子宫、子宫内膜、子宫肌层和前列腺中最高。LBFL305的表达水平似乎在免疫系统中的器官(例如白细胞、淋巴结、脾脏和胸腺)中最高,其次是得自阑尾、动脉、骨头和肺的样品。而且在表3c中所列的其它大多数组织中检测到了更低的表达水平。LBFL306的表达水平似乎在免疫系统的器官(例如淋巴结、脾脏和胸腺)和生殖系统的器官(例如乳房、子宫内膜、前列腺和子宫)中最高。
表3a-48774_at的e-Northern数据正常组织中的LBFL301基因表达总存在频率组织存在不存在下面25% 平均上面75%0.5492脂肪29/33 4/33 130.90 200.78 302.98肾上腺1/12 11/12 -4.10 8.75 22.07阑尾1/3 2/3 21.54 31.31 71.81动脉3/3 0/3 148.46 203.96 262.32膀胱6/7 1/7 142.72 195.44 361.02骨2/4 2/4 75.00 240.38 412.62乳房74/82 8/82 104.43 222.98 506.27小脑0/5 5/5 -7.5 1 -6.91 0.94子宫颈75/99 24/99 42.04 93.36 144.25结肠36/148 112/148 1.75 12.16 29.05皮层前叶1/7 6/7 5.96 14.07 18.05皮层颞叶0/3 3/3 -0.59 4.13 4.66十二指肠9/61 52/61 3.99 11.54 20.62子宫内膜16/21 5/21 46.25 85.18 113.55食管14/27 13/27 17.91 42.08 81.58输卵管21/51 30/51 7.97 20.39 33.96胆囊4/8 4/8 16.22 80.97 400.47心脏0/3 3/3 -3.80 6.00 11.57海马1/5 4/5 -6.49 -0.18 7.81肾12/87 75/87 -14.80 -4.61 9.24喉4/4 0/4 48.51 119.88 248.62左心房64/141 77/141 8.19 27.15 61.94左心室2/15 13/15 -7.49 7.08 13.24肝0/33 33/33 -15.13 -8.62 0.03肺43/92 49/92 10.45 30.14 63.21淋巴结9/12 3/12 43.28 81.96 225.75肌肉19/38 19/38 23.70 40.22 108.40子宫肌层68/106 38/106 19.39 56.42 99.78网膜12/16 4/16 76.26 148.41 236.54卵巢26/75 49/75 4.20 21.96 47.43
胰腺7/34 27/34 -12.61 0.83 17.69胎盘5/5 0/5 284.63 361.07 414.51前列腺7/32 25/32 0.03 12.08 36.90直肠17/44 27/44 3.23 12.57 37.41右心房60/171 111/171 2.99 15.73 53.22右心室43/160 117/160 1.85 16.64 39.58皮肤56/59 3/59 321.45 906.78 1515.60小肠18/68 50/68 0.41 12.19 28.53软组织5/6 1/6 148.50 202.33 794.03脾5/29 24/29 -3.61 3.04 12.46胃15/45 30/45 7.73 18.66 50.97睾丸3/5 2/5 14.11 27.34 64.24胸腺19/71 52/71 4.06 25.61 40.45甲状腺7/19 12/19 12.43 32.64 40.31子宫35/56 21/56 32.20 44.73 143.10WBC 1/41 40/41 -18.91 -13.33 -6.24
表3b-35832_at的e-Northern数据正常组织中的LBFL304基因表达片段总存在频率组织存在不存在下面25%平均上面75%35832_at 0.5228脂肪26/34 8/34 29.09 59.51 89.67肾上腺1/12 11/12 -11.00 -6.08 8.14阑尾1/3 2/3 43.26 53.50 66.52动脉3/4 1/4 182.70 291.81 428.36膀胱5/7 2/7 56.36 62.71 64.68骨3/4 1/4 19.34 77.40 167.06乳房65/82 17/82 33.67 63.19 108.61小脑0/5 5/5 -19.26 -14.78 -13.16子宫颈69/102 33/102 18.76 57.45 94.99结肠85/146 61/146 10.73 35.22 87.91皮层前叶1/7 6/7 -5.03 8.78 14.71皮层颞叶0/3 3/3 -16.73 -16.67 -15.85十二指肠19/53 34/53 6.47 20.39 41.95子宫内膜15/21 6/21 31.44 93.20 137.68
食管15/27 12/27 5.12 27.03 52.89输卵管19/47 28/47 5.38 22.48 54.99胆囊2/7 5/7 8.71 28.94 50.85心脏0/3 3/3 -35.98 -28.2 5 -6.72海马2/5 3/5 -7.43 -3.64 5.68肾28/89 61/89 1.67 20.45 45.18喉4/4 0/4 36.13 54.20 79.75左心房80/141 61/141 8.32 25.37 52.28左心室0/15 15/15 -21.85 -17.01 -8.17肝2/35 33/35 -10.51 0.02 8.05肺29/93 64/93 2.56 19.47 43.63淋巴结3/12 9/12 -17.5 8 -2.85 9.56肌肉12/42 30/42 -13.74 3.99 23.23子宫肌层92/108 16/108 67.57 129.39 203.58网膜14/15 1/15 176.65 310.28 368.41卵巢31/74 43/74 0.66 27.78 54.33胰腺4/33 29/33 -9.60 2.09 9.94胎盘0/5 5/5 -21.32 -3.06 6.08前列腺30/32 2/32 82.37 104.56 190.72直肠37/44 7/44 51.53 86.73 125.67右心房69/170 101/17 0 -3.30 8.80 33.56右心室35/160 125/16 0 -11.65 -0.46 16.02皮肤28/61 33/61 4.2 2 25.33 67.56小肠36/67 31/67 10.76 33.92 64.75软组织4/6 2/6 25.95 40.91 58.70脾1/29 28/29 -19.20 -13.77 -6.69胃16/47 31/47 -8.30 13.38 47.93睾丸1/5 4/5 -18.20 5.01 37.66胸腺1/73 72/73 -22.55 -12.50 -3.27甲状腺14/19 5/19 45.56 98.30 141.24子宫43/58 15/58 37.47 103.26 180.98 WBC0/43 43/43 -33.45 -25.32-20.23
表3c-48774_at的e-Northern数据正常组织中的LBFL305基因表达总存在频率组织存在不存在下面25%平均上面75%0.9444脂肪31/32 1/32 221.82 286.63 38 0.88肾上腺12/12 0/12 162.12 214.21 310.82阑尾3/3 0/3 352.94 506.01 633.71动脉3/3 0/3 343.80 419.88 643.55膀胱5/5 0/5 221.82 290.82 301.11骨3/3 0/3 410.63 508.38 662.78乳房80/80 0/80 236.84 279.81 338.22小脑5/5 0/5 182.09 198.28 283.55子宫颈97/101 4/101 179.11 246.50 317.62结肠146/151 5/151 247.18 314.49 389.23皮层前叶7/7 0/7 222.19 230.28 268.13皮层颞叶3/3 0/3 305.66 365.62 377.16十二指肠58/61 3/61 206.17 276.14 331.91子宫内膜21/21 0/21 158.91 193.40 257.17食管25/27 2/27 182.29 223.24 303.93输卵管50/51 1/51 168.69 220.72 265.95胆囊7/8 1/8 237.67 270.08 312.45心脏2/3 1/3 44.79 55.84 56.46海马5/5 0/5 165.94 212.72 32 8.59肾79/86 7/86 121.83 158.99 209.67喉4/4 0/4 140.76 209.46 302.84左心房127/141 14/141 58.48 92.78 123.06左心室9/15 6/15 50.50 74.69 101.06肝27/34 7/34 87.73 146.60 197.27肺92/93 1/93 365.58 454.87 550.48淋巴结11/11 0/11 493.34 943.95 1141.06肌肉19/39 20/39 41.41 64.44 110.74子宫肌层104/106 2/106 188.94 263.73 322.65网膜15/15 0/15 198.02 244.56 334.75卵巢70/74 4/74 133.44 181.39 246.40胰腺13/34 21/34 24.30 53.13 84.64胎盘4/5 1/5 156.58 174.21 182.71前列腺32/32 0/32 184.16 234.60 289.05直肠42/43 1/43 284.60 365.66 434.01右心房148/169 21/169 54.96 89.92 129.13
右心室132/160 28/160 55.58 78.85 114.70皮肤57/59 2/59 250.81 320.57 398.56小肠64/68 4/68 196.50 279.29 393.83软组织6/6 0/6 234.21 307.07 363.66脾31/31 0/31 775.25 879.84 1022.49胃41/47 6/47 137.91 217.53 3 38.54睾丸5/5 0/5 326.62 358.69 377.26胸腺71/71 0/71 691.12 802.96 9 84.42甲状腺18/18 0/18 121.11 162.16 238.53子宫57/58 1/58 157.19 202.53 265.91 WBC38/40 2/40 1863.06 2264.27 2743.82
表3d-48774_at的e-Northern数据正常组织中的LBFL306基因表达总存在频率组织存在不存在下面25% 平均上面75%0.8143脂肪31/32 1/32 184.04 242.67 285.20肾上腺6/12 6/12 130.70 157.08 187.26阑尾3/3 0/3 259.39 301.05 388.31动脉4/4 0/4 168.95 207.06 295.97膀胱7/8 1/8 196.52 239.43 374.54骨4/4 0/4 209.35 226.22 292.55乳房60/61 1/61 238.09 315.29 421.47子宫颈92/102 10/102 180.90 224.31 342.25结肠168/192 24/192 147.41 175.83 215.95皮层前叶5/5 0/5 133.94 148.22 162.91皮层颞叶3/3 0/3 137.28 147.77 172.44十二指肠68/68 0/68 186.24 218.73 336.00子宫内膜19/19 0/19 273.57 359.17 436.85食管14/25 11/25 105.83 140.56 195.89胆囊7/8 1/8 232.71 293.00 410.47心脏1/3 2/3 86.39 100.48 129.68海马9/10 1/10 125.62 140.94 194.06肾53/91 38/91 108.29 147.35 186.69喉3/4 1/4 160.96 190.50 219.55左心房65/143 78/143 100.94 128.86 157.57左心室0/13 13/13 82.54 106.63 117.06肝15/44 29/44 145.82 204.77 244.58肺104/114 10/114 168.03 203.35 283.11淋巴结14/14 0/14 207.66 319.53 366.70
淋巴细胞(B+T细胞)24/24 0/24 224.46 292.01 348.07肌肉31/40 9/40 183.43 24 0.15 329.99子宫肌层122/128 6/128 209.83 244.58 294.20网膜13/15 2/15 162.83 236.23 265.24卵巢80/81 1/81 219.28 259.00 331.64胰腺8/40 32/40 97.07 136.80 174.54前列腺47/47 0/47 318.31 397.81 525.43直肠38/46 8/46 143.79 188.95 232.42右心房87/162 75/162 104.22 132.56 161.54皮肤38/44 6/44 162.29 198.90 236.86小肠72/79 7/79 184.41 230.96 270.34软组织5/5 0/5 240.30 258.33 499.21脾36/36 0/36 253.03 322.87 390.61胃32/54 22/54 139.62 174.76 269.47胸腺70/70 0/70 352.12 438.94 511.11甲状腺25/25 0/25 177.32 211.27 276.25子宫54/56 2/56 243.74 312.71 387.50WBC21/25 4/25 149.63 176.72 209.49
工业实用性
实施例3
用于胃癌筛选的LBFL301,LBFL304,LBFL305或LBFL306mRNA的检测
如实施例1中所述,即通过利用GeneChip筛选mRNA样品,或者如实施例2中所述,即通过利用RNA印迹筛选mRNA样品,测定了对应于SEQ ID NO1,3,5,7,9,11,13,17,19或21的mRNA在胃组织活检样品中的表达水平。或者,可以对得自恶性状态或非恶性状态的非-胃增生组织的样品进行分析。得自胃癌患者的胃组织样品和得自正常个体的胃组织样品可以被用作阳性和阴性对照。利用任何分析基因表达的手段进行检测,表达水平高于正常对照则是胃癌的表征或表示有可能患上胃癌。
尽管参照上述实施例已经对本发明进行了详尽的描述,但是应当理解可以进行各种修改而不偏离本发明的实质。因此,本发明仅仅通过下列权利要求得到限定。本申请中引用的所有专利、专利申请和公开出版物被本文全部引入作为参考。
序列表
<110>LG Life Sciences Ltd.
<120>胃癌相关的基因家族
<130>PC03015-LG
<150>US 60/402,904
<151>2002-08-14
<150>US 60/404,408
<151>2002-08-20
<150>US 60/405,304
<151>2002-08-23
<150>US 60/421,582
<151>2002-10-28
<160>22
<170>KopatentIn 1.71
<210>1
<211>1272
<212>DNA
<213>智人
<220>
<221>CDS
<222>(131)..(859)
<223>基因LBFL301,克隆AD12
<400>1
ggcgcgcggg tgaaaggcgc attgatgcag cctgcggcgg cctcggagcg cggcggagcc60
agacgctgac cacgttcctc tcctcggtct cctccgcctc cagctccgcg ctgcccggca120
gccgggagcc atg cga ccc cag ggc ccc gcc gcc tcc ccg cag cgg ctc cgc 172
Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg
1 5 10
ggc ctc ctg ctg ctc ctg ctg ctg cag ctg ccc gcg ccg tcg agc gcc 220
Gly Leu Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Ser Ala
15 20 25 30
tct gag atc ccc aag ggg aag caa aag gcg cag ctc cgg cag agg gag 268
Ser Glu Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu
35 40 45
gtg gtg gac ctg tat aat gga atg tgc tta caa ggg cca gca gga gtg316
Val Val Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val
50 55 60
cct ggt cga gac ggg agc cct ggg gcc aat ggc att ccg ggt aca cct364
Pro Gly Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro
65 70 75
ggg atc cca ggt cgg gat gga ttc aaa gga gaa aag ggg gaa tgt ctg412
Gly Ile Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu
80 85 90
agg gaa agc ttt gag gag tcc tgg aca ccc aac tac aag cag tgt tca460
Arg Glu Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser
95 100 105 110
tgg agt tca ttg aat tat ggc ata gat ctt ggg aaa att gcg gag tgt508
Trp Ser Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Glu Cys
115 120 125
aca ttt aca aag atg cgt tca aat agt gct cta aga gtt ttg ttc agt556
Thr Phe Thr Lys Met Arg Ser Asn Ser Ala Leu Arg Val Leu Phe Ser
130 135 140
ggc tca ctt cgg cta aaa tgc aga aat gca tgc tgt cag cgt tgg tat604
Gly Ser Leu Arg Leu Lys Cys Arg Asn Ala Cys Cys Gln Arg Trp Tyr
145 150 155
ttc aca ttc aat gga gct gaa tgt tca gga cct ctt ccc att gaa gct652
Phe Thr Phe Asn Gly Ala Glu Cys Ser Gly Pro Leu Pro Ile Glu Ala
160 165 170
ata att tat ttg gac caa gga agc cct gaa atg aat tca aca att aat700
Ile Ile Tyr Leu Asp Gln Gly Ser Pro Glu Met Asn Ser Thr Ile Asn
175 180 185 190
att cat cgc act tct tct gtg gaa gga ctt tgt gaa gga att ggt gct748
Ile His Arg Thr Ser Ser Val Glu Gly Leu Cys Glu Gly Ile Gly Ala
195 200 205
gga tta gtg gat gtt gct atc tgg gtt ggc act tgt tca gat tac cca796
Gly Leu Val Asp Val Ala Ile Trp Val Gly Thr Cys Ser Asp Tyr Pro
210 215 220
aaa gga gat gct tct act gga tgg aat tca gtt tct cgc atc att att844
Lys Gly Asp Ala Ser Thr Gly Trp Asn Ser Val Ser Arg Ile Ile Ile
225 230 235
gaa gaa cta cca aaa t aaatgcttta attttcattt gctacctctt tttttattat900
Glu Glu Leu Pro Lys
240
gccttggaat ggttcactta aatgacattt taaataagtt tatgtataca tctgaatgaa960
aagcaaagct aaatatgttt acagaccaaa gtgtgatttc acactgtttt taaatctagc1020
attattcatt ttgcttcaat caaaagtggt ttcaatattt tttttagttg gttagaatac1080
tttcttcata gtcacattct ctcaacctat aatttggaat attgttgtgg tcttttgttt1140
tttctcttag tatagcattt ttaaaaaaat ataaaagcta ccaatctttg tacaatttgt1200
aaatgttaag aatttttttt atatctgtta aataaaaatt atttccaaca accttaaaaa1260
aaaaaaaaaa aa1272
<210>2
<211>243
<212>PRT
<213>智人
<400>2
Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg Gly Leu
1 5 10 15
Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Ser Ala Ser Glu
20 25 30
Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu Val Val
35 40 45
Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val Pro Gly
50 55 60
Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro Gly Ile
65 70 75 80
Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu Arg Glu
85 90 95
Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser Trp Ser
100 105 110
Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Glu Cys Thr Phe
115 120 125
Thr Lys Met Arg Ser Asn Ser Ala Leu Arg Val Leu Phe Ser Gly Ser
130 135 140
Leu Arg Leu Lys Cys Arg Asn Ala Cys Cys Gln Arg Trp Tyr Phe Thr
145 150 155 160
Phe Asn Gly Ala Glu Cys Ser Gly Pro Leu Pro Ile Glu Ala Ile Ile
165 170 175
Tyr Leu Asp Gln Gly Ser Pro Glu Met Asn Ser Thr Ile Asn Ile His
180 185 190
Arg Thr Ser Ser Val Glu Gly Leu Cys Glu Gly Ile Gly Ala Gly Leu
195 200 205
Val Asp Val Ala Ile Trp Val Gly Thr Cys Ser Asp Tyr Pro Lys Gly
210 215 220
Asp Ala Ser Thr Gly Trp Asn Ser Val Ser Arg Ile Ile Ile Glu Glu
225 230 235 240
Leu Pro Lys
<210>3
<211>1355
<212>DNA
<213>智人
<220>
<221>CDS
<222>(174)..(584)
<223>基因LBFL301,克隆CH4
<400>3
ctccgggtgt cgcgggggcg ggaggaatta agggagggag agaggcgcgc gggtgaaagg60
cgcattgatg cagcctgcgg cggcctcgga gcgcggcgga gccagacgct gaccacgttc120
ctctcctcgg tctcctccgc ctccagctcc gcgctgcccg gcagccggga gcc 173
atg cga ccc cag ggc ccc gcc gcc tcc ccg cag cgg ctc cgc ggc ctc 221
Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg Gly Leu
1 5 10 15
ctg ctg ctc ctg ctg ctg cag ctg ccc gcg ccg tcg agc gcc tct gag 269
Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Ser Ala Ser Glu
20 25 30
atc ccc aag ggg aag caa aag gcg cag ctc cgg cag agg gag gtg gtg 317
Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu Val Val
35 40 45
gac ctg tat aat gga atg tgc tta caa ggg cca gca gga gtg cct ggt 365
Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val Pro Gly
50 55 60
cga gac ggg agc cct ggg gcc aat ggc att ccg ggt aca cct ggg atc 413
Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro Gly Ile
65 70 75 80
cca ggt cgg gat gga ttc aaa gga gaa aag ggg gaa tgt ctg agg gaa 461
Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu Arg Glu
85 90 95
agc ttt gag gag tcc tgg aca ccc aac tac aag cag tgt tca tgg agt 509
Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser Trp Ser
100 105 110
tca ttg aat tat ggc ata gat ctt ggg aaa att gcg aaa cac gtc aag 557
Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Lys His Val Lys
115 120 125
agt caa tac gaa tgg aca gaa cta gtc tagaat gagtgtacat ttacaaagat610
Ser Gln Tyr Glu Trp Thr Glu Leu Val
130 135
gcgttcaaat agtgctctaa gagttttgtt cagtggctca cttcggctaa aatgcagaaa 670
tgcatgctgt cagcgttggt atttcacatt caatggagct gaatgttcag gacctcttcc 730
cattgaagct ataatttatt tggaccaagg aagccctgaa atgaattcaa caattaatat 790
tcatcgcact tcttctgtgg aaggactttg tgaaggaatt ggtgctggat tagtggatgt 850
tgctatctgg gttggcactt gttcagatta cccaaaagga gatgcttcta ctggatggaa 910
ttcagtttct cgcatcatta ttgaagaact accaaaataa atgctttaat tttcatttgc 970
tacctctttt tttattatgc cttggaatgg ttcacttaaa tgacatttta aataagttta 1030
tgtatacatc tgaatgaaaa gcaaagctaa atatgtttac agaccaaagt gtgatttcac 1090
actgttttta aatctagcat tattcatttt gcttcaatca aaagtggttt caatattttt 1150
tttagttggt tagaatactt tcttcatagt cacattctct caacctataa tttggaatat 1210
tgttgtggtc ttttgttttt tctcttagta tagcattttt aaaaaaatat aaaagctacc 1270
aatctttgta caatttgtaa atgttaagaa ttttttttat atctgttaaa taaaaattat1330
ttccaacaaa aaaaaaaaaa aaaaa 1355
<210>4
<211>137
<212>PRT
<213>智人
<400>4
Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg Gly Leu
1 5 10 15
Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Set Ala Ser Glu
20 25 30
Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu Val Val
35 40 45
Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val Pro Gly
50 55 60
Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro Gly Ile
65 70 75 80
Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu Arg Glu
85 90 95
Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser Trp Ser
100 105 110
Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Lys His Val Lys
115 120 125
Ser Gln Tyr Glu Trp Thr Glu Leu Val
130 135
<210>5
<211>2500
<212>DNA
<213>智人
<220>
<221>CDS
<222>(38)..(892)
<223>克隆LBFL304,ORF1
<400>5
ggatataagc agtgcaaccc aagacctaag aatcttg atg ttg gaa ata aag 52
Met Leu Glu Ile Lys
1 5
atg gag gaa gct atg acc tac aca gag gac agt tat ggg atg gat ggg 100
Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly
10 15 20
aag gtt aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta 148
Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu
25 30 35
gag gag cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac 196
Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn
40 45 50
tac aga ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat 244
Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp
55 60 65
aga gta ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat 292
Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn
70 75 80 85
aag act caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag 340
Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu
90 95 100
cac gct gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca 388
His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro
105 110 115
agg cat aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt 436
Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu
120 125 130
caa acc ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt 484
Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu
135 140 145
gaa tgg aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac 532
Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His
150 155 160 165
tgg aga aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg 580
Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu
170 175 180
gaa acc gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc 628
Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro
185 190 195
agc ccc agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag676
Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln
200 205 210
tat ggt ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct724
Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro
215 220 225
gtg cat tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc772
Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr
230 235 240 245
gca gaa cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag820
Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys
250 255 260
gtg gag aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc868
Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser
265 270 275
gcc tcc tct tca ctc tcc tct gat tagatgaa actgttacct taccctaaac920
Ala Ser Ser Ser Leu Ser Ser Asp
280285
acagtatttc tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac 980
attccaagct accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg 1040
tgtgcacacg gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg 1100
gggatatttg ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac 1160
agtattatct tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg 1220
ctagaatggt gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca 1280
cttccactgc ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc 1340
cgtcattttc agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta 1400
gtcttatttt tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa 1460
gtcaaataaa cccccaagga cgacacacag tatggatcac atattgtttg acattaagct 1520
tttgccagaa aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg 1580
catggctaat aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct 1640
gctctctctg tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata1700
ttttgggtta ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt1760
tggttttctt ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt1820
tacaccaaga acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac1880
aagagaagtt aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt1940
ctgatatctt ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata2000
tccttgttgt gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag2060
taccctccta ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct2120
tcttattttt agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt2180
aaactctttt aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct2240
ttatcataga ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg2300
tgggatgaca gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca2360
agttattagg aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata2420
gaacaattct ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa2480
actttaaaaa aaaaaaaaaa2500
<210>6
<211>285
<212>PRT
<213>智人
<400>6
Met Leu Glu Ile Lys Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser
1 5 10 15
Tyr Gly Met Asp Gly Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile
20 25 30
Asn Trp Gln Gly Leu Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr
35 40 45
Glu Tyr Arg Gln Asn Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr
50 55 60
Leu Lys Asp Leu Asp Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu
65 70 75 80
Gln Asn Lys Thr Asn Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu
85 90 95
Val Val Ser Ala Glu His Ala Val Ser Met Glu Met Ala Set Ala Asp
100 105 110
Ser Asp Glu Asp Pro Arg His Lys Val Gly Lys Thr Pro His Leu Thr
115 120 125
Leu Pro Ala Asp Leu Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser
130 135 140
Pro Glu Ser Lys Leu Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His
145 150 155 160
Leu Asn Ser Glu His Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu
165 170 175
Glu Thr Asn His Leu Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu
180 185 190
Leu Glu Leu Gly Pro Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro
195 200 205
Lys Glu Leu Pro Gln Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp
210 215 220
Gln Leu Tyr Leu Pro Val His Ser Asp Gly Ile Ser Val His Gln Met
225 230 235 240
Phe Thr Met Ala Thr Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly
245 250 255
Lys Met Leu Thr Lys Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln
260 265 270
His Leu Glu Gly Ser Ala Ser Ser Ser Leu Ser Ser Asp
275 280 285
<210>7
<211>2500
<212>DNA
<213>智人
<220>
<221>CDS
<222>(53)..(892)
<223>克隆LBFL304,ORF2
<400>7
ggatataagc agtgcaaccc aagacctaag aatcttgatg ttggaaataa ag 52
atg gag gaa gct atg acc tac aca gag gac agt tat ggg atg gat ggg100
Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly
1 5 10 15
aag gtt aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta148
Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu
20 25 30
gag gag cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac196
Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn
35 40 45
tac aga ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat244
Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp
50 55 60
aga gta ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat292
Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn
65 70 75 80
aag act caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag340
Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu
85 90 95
cac gct gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca388
His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro
100 105 110
agg cat aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt436
Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu
115 120 125
caa acc ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt484
Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu
130 135 140
gaa tgg aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac532
Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His
145 150 155 160
tgg aga aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg580
Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu
165 170 175
gaa acc gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc 628
Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro
180 185 190
agc ccc agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag 676
Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln
195 200 205
tat ggt ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct 724
Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro
210 215 220
gtg cat tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc 772
Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr
225 230 235 240
gca gaa cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag 820
Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys
245 250 255
gtg gag aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc 868
Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser
260 265 270
gcc tcc tct tca ctc tcc tct gat tagatgaa actgttacct taccctaaac 920
Ala Ser Ser Ser Leu Ser Ser Asp
275 280
acagtatttc tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac 980
attccaagct accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg1040
tgtgcacacg gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg1100
gggatatttg ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac1160
agtattatct tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg1220
ctagaatggt gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca1280
cttccactgc ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc1340
cgtcattttc agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta1400
gtcttatttt tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa1460
gtcaaataaa cccccaagga cgacacacag tatggatcac atattgtttg acattaagct1520
tttgccagaa aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg1580
catggctaat aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct1640
gctctctctg tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata1700
ttttgggtta ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt1760
tggttttctt ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt1820
tacaccaaga acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac1880
aagagaagtt aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt1940
ctgatatctt ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata2000
tccttgttgt gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag2060
taccctccta ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct2120
tcttattttt agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt2180
aaactctttt aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct2240
ttatcataga ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg2300
tgggatgaca gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca2360
agttattagg aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata2420
gaacaattct ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa2480
actttaaaaa aaaaaaaaaa2500
<210>8
<211>280
<212>PRT
<213>智人
<400>8
Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly
1 5 10 15
Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu
20 25 30
Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn
35 40 45
Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp
50 55 60
Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn
65 70 75 80
Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu
85 90 95
His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro
100 105 110
Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu
115 120 125
Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu
130 135 140
Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His
145 150 155 160
Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu
165 170 175
Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro
180 185 190
Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln
195 200 205
Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro
210 215 220
Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr
225 230 235 240
Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys
245 250 255
Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser
260 265 270
Ala Ser Ser Ser Leu Ser Ser Asp
275 280
<210>9
<211>2500
<212>DNA
<213>智人
<220>
<221>CDS
<222>(65)..(892)
<223>克隆LBFL304,ORF3
<400>9
ggatataagc agtgcaaccc aagacctaag aatcttgatg ttggaaataa agatggagga 60
agct atg acc tac aca gag gac agt tat ggg atg gat ggg aag gtt 106
Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly Lys Val
1 5 10
aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta gag gag 154
Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu Glu Glu
15 20 25 30
cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac tac aga 202
Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn Tyr Arg
35 40 45
ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat aga gta 250
Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp Arg Val
50 55 60
ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat aag act 298
Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn Lys Thr
65 70 75
caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag cac gct 346
Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu His Ala
80 85 90
gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca agg cat 394
Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro Arg His
95 100 105 110
aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt caa acc 442
Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu Gln Thr
115 120 125
ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt gaa tgg 490
Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu Glu Trp
130 135 140
aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac tgg aga 538
Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His Trp Arg
145 150 155
aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg gaa acc 586
Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu Glu Thr
160 165 170
gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc agc ccc 634
Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro Ser Pro
175 180 185 190
agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag tat ggt 682
Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln Tyr Gly
195 200 205
ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct gtg cat 730
Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro Val His
210 215 220
tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc gca gaa 778
Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr Ala Glu
225 230 235
cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag gtg gag 826
His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys Val Glu
240 245 250
aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc gcc tcc 874
Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser Ala Ser
255 260 265 270
tct tca ctc tcc tct gat tagatgaa actgttacct taccctaaac acagtatttc 930
Ser Ser Leu Ser Ser Asp
275
tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac attccaagct 990
accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg tgtgcacacg1050
gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg gggatatttg1110
ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac agtattatct1170
tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg ctagaatggt1230
gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca cttccactgc1290
ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc cgtcattttc1350
agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta gtcttatttt1410
tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa gtcaaataaa1470
cccccaagga cgacacacag tatggatcac atattgtttg acattaagct tttgccagaa1530
aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg catggctaat1590
aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct gctctctctg1650
tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata ttttgggtta1710
ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt tggttttctt1770
ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt tacaccaaga1830
acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac aagagaagtt1890
aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt ctgatatctt1950
ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata tccttgttgt2010
gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag taccctccta2070
ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct tcttattttt2130
agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt aaactctttt2190
aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct ttatcataga2250
ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg tgggatgaca2310
gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca agttattagg2370
aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata gaacaattct2430
ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa actttaaaaa2490
aaaaaaaaaa 2500
<210>10
<211>276
<212>PRT
<213>智人
<400>10
Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly Lys Val Asn Gln
1 5 10 15
Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu Glu Glu Leu His
20 25 30
Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn Tyr Arg Leu Ser
35 40 45
Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp Arg Val Phe Ala
50 55 60
Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn Lys Thr Gln Thr
65 70 75 80
Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu His Ala Val Ser
85 90 95
Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro Arg His Lys Val
100 105 110
Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu Gln Thr Leu His
115 120 125
Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu Glu Trp Asn Asn
130 135 140
Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His Trp Arg Lys Thr
145 150 155 160
Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu Glu Thr Asp Phe
165 170 175
Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro Ser Pro Arg Leu
180 185 190
Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln Tyr Gly Gly Pro
195 200 205
Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro Val His Ser Asp
210 215 220
Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr Ala Glu His Arg
225 230 235 240
Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys Val Glu Lys Asn
245 250 255
His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser Ala Ser Ser Ser
260 265 270
Leu Ser Ser Asp
275
<210>11
<211>2500
<212>DNA
<213>智人
<220>
<221>CDS
<222>(92)..(892)
<223>克隆LBFL304,ORF4
<400>11
ggatataagc agtgcaaccc aagacctaag aatcttgatg ttggaaataa agatggagga60
agctatgacc tacacagagg acagttatgg g atg gat ggg aag gtt106
Met Asp Gly Lys Val
1 5
aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta gag gag154
Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu Glu Glu
10 15 20
cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac tac aga202
Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn Tyr Arg
25 30 35
ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat aga gta250
Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp Arg Val
40 45 50
ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat aag act298
Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn Lys Thr
55 60 65
caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag cac gct346
Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu His Ala
70 75 80 85
gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca agg cat394
Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro Arg His
90 95 100
aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt caa acc442
Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu Gln Thr
105 110 115
ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt gaa tgg490
Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu Glu Trp
120 125 130
aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac tgg aga538
Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His Trp Arg
135 140 145
aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg gaa acc 586
Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu Glu Thr
150 155 160 165
gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc agc ccc 634
Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro Ser Pro
170 175 180
agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag tat ggt 682
Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln Tyr Gly
185 190 195
ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct gtg cat 730
Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro Val His
200 205 210
tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc gca gaa 778
Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr Ala Glu
215 220 225
cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag gtg gag 826
His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys Val Glu
230 235 240 245
aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc gcc tcc 874
Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser Ala Ser
250 255 260
tct tca ctc tcc tct gat tagatgaa actgttacct taccctaaac acagtatttc 930
Ser Ser Leu Ser Ser Asp
265
tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac attccaagct 990
accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg tgtgcacacg1050
gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg gggatatttg1110
ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac agtattatct1170
tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg ctagaatggt1230
gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca cttccactgc1290
ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc cgtcattttc1350
agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta gtcttatttt1410
tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa gtcaaataaa1470
cccccaagga cgacacacag tatggatcac atattgtttg acattaagct tttgccagaa1530
aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg catggctaat1590
aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct gctctctctg1650
tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata ttttgggtta1710
ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt tggttttctt1770
ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt tacaccaaga1830
acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac aagagaagtt1890
aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt ctgatatctt1950
ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata tccttgttgt2010
gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag taccctccta2070
ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct tcttattttt2130
agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt aaactctttt2190
aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct ttatcataga2250
ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg tgggatgaca2310
gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca agttattagg2370
aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata gaacaattct2430
ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa actttaaaaa2490
aaaaaaaaaa 2500
<210>12
<211>267
<212>PRT
<213>智人
<400>12
Met Asp Gly Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp
1 5 10 15
Gln Gly Leu Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr
20 25 30
Arg Gln Asn Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys
35 40 45
Asp Leu Asp Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn
50 55 60
Lys Thr Asn Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val
65 70 75 80
Ser Ala Glu His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp
85 90 95
Glu Asp Pro Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro
100 105 110
Ala Asp Leu Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu
115 120 125
Ser Lys Leu Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn
130 135 140
Ser Glu His Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr
145 150 155 160
Asn His Leu Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu
165 170 175
Leu Gly Pro Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu
180 185 190
Leu Pro Gln Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu
195 200 205
Tyr Leu Pro Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr
210 215 220
Met Ala Thr Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met
225 230 235 240
Leu Thr Lys Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu
245 250 255
Glu Gly Ser Ala Ser Ser Ser Leu Ser Ser Asp
260 265
<210>13
<211>6405
<212>DNA
<213>智人
<220>
<221>CDS
<222>(49)..(1434)
<223>基因LBFL305
<400>13
gcgggaggat ggagcagtga gcgggtctgg gcggctgctg gcagcgcc atg gag acg 57
Met Glu Thr
1
gta cag ctg agg aac ccg ccg cgc cgg cag ctg aaa aag ttg gat gaa105
Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys Leu Asp Glu
5 10 15
gat agt tta acc aaa caa cca gaa gaa gta ttt gat gtc tta gag aaa153
Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val Leu Glu Lys
20 25 30 35
ctt gga gaa ggg tcc tat ggc agc gta tac aaa gct att cat aaa gag201
Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile His Lys Glu
40 45 50
acc ggc cag att gtt gct att aag caa gtt cct gtg gaa tca gac ctc249
Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu Ser Asp Leu
55 60 65
cag gag ata atc aaa gaa atc tct ata atg cag caa tgt gac agc cct297
Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys Asp Ser Pro
70 75 80
cat gta gtc aaa tat tac ggc agt tat ttt aag aac aca gac tta tgg345
His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr Asp Leu Trp
85 90 95
atc gtt atg gag tac tgt ggg gct ggt tct gta tct gat atc att cga393
Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp Ile Ile Arg
100 105 110 115
tta cga aat aaa acg tta aca gaa gat gaa ata gct aca ata tta caa441
Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr Ile Leu Gln
120 125 130
tca act ctt aag gga ctt gaa tac ctt cat ttt atg aga aaa ata cac489
Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg Lys Ile His
135 140 145
cga gat atc aag gca gga aat att ttg cta aat aca gaa gga cat gca537
Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu Gly His Ala
150 155160
aaa ctt gca gat ttt ggg gta gca ggt caa ctt aca gat acc atg gcc585
Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp Thr Met Ala
165 170 175
aag cgg aat aca gtg ata gga aca cca ttt tgg atg gct cca gaa gtg633
Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala Pro Glu Val
180 185 190 195
att cag gaa att gga tac aac tgt gta gca gac atc tgg tcc ctg gga681
Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp Ser Leu Gly
200 205 210
ata act gcc ata gaa atg gct gaa gga aag ccc cct tat gct gat atc729
Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr Ala Asp Ile
215 220 225
cat cca atg agg gca atc ttc atg att cct aca aat cct cct ccc aca777
His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro Pro Pro Thr
230 235 240
ttc cga aaa cca gag cta tgg tca gat aac ttt aca gat ttt gtg aaa825
Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp Phe Val Lys
245 250 255
cag tgt ctt gta aag agc cct gag cag agg gcc aca gcc act cag ctc873
Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala Thr Gln Leu
260 265 270 275
ctg cag cac cca ttt gtc agg agt gcc aaa gga gtg tca ata ctg cga 921
Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser Ile Leu Arg
280 285 290
gac tta att aat gaa gcc atg gat gtg aaa ctg aaa cgc cag gaa tcc969
Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg Gln Glu Ser
295 300 305
cag cag cgg gaa gtg gac cag gac gat gaa gaa aac tca gaa gag gat 1017
Gln Gln Arg Glu Val Asp Gln Asp Asp Glu Glu Asn Ser Glu Glu Asp
310 315 320
gaa atg gat tct ggc acg atg gtt cga gca gtg ggt gat gag atg ggc 1065
Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp Glu Met Gly
325 330 335
act gtc cga gta gcc agc acc atg act gat gga gcc aat act atg att 1113
Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn Thr Met Ile
340 345 350 355
gag cac gat gac acg ttg cca tca caa ctg ggc acc atg gtg atc aat 1161
Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met Val Ile Asn
360 365 370
gca gag gat gag gaa gag gaa gga act atg aaa aga agg gat gag acc 1209
Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg Asp Glu Thr
375 380 385
atg cag cct gcg aaa cca tcc ttt ctt gaa tat ttt gaa caa aaa gaa 1257
Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu Gln Lys Glu
390 395 400
aag gaa aac cag atc aac agc ttt ggc aag agt gta cct ggt cca ctg 1305
Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro Gly Pro Leu
405 410 415
aaa aat tct tca gat tgg aaa ata cca cag gat gga gac tac gag ttt 1353
Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp Tyr Glu Phe
420 425 430 435
aaa act agc caa gaa cag cag tct gga aaa gac ata tgt atc caa aat 1401
Lys Thr Ser Gln Glu Gln Gln Ser Gly Lys Asp Ile Cys Ile Gln Asn
440 445 450
tgc cag gga aac ctg ctg tgt aga tac gct ttc tgagaa accacatgct1450
Cys Gln Gly Asn Leu Leu Cys Arg Tyr Ala Phe
455 460
taagagttgg acagtggagg accttcagaa gaggctcttg gccctggacc ccatgatgga1510
gcaggagatt gaagagatcc ggcagaagta ccagtccaag cggcagccca tcctggatgc1570
catagaggct aagaagagac ggcaacaaaa cttctgagca aggccaggct gtgagggccc1630
cagctccacc caggctttgg gtgaattctg gatggcttgc ctcatgtttg ttagccagca1690
cttctgctct gtcgtctctc cacagcacct ttgtgaactc aggaatgtgc gccagtggga1750
agggctctct tgacagtcag cgtgccatct tgatgtgtgt atgtacattg gtcaggtata1810
ttatctcaaa ggatttatat tggcgctttt aactcagagt tttaaacccc aggaacagag1870
actcctagtt gagtgatagc tgggaaagtt ttacattgtc tgtttttctt ctcccaatag1930
ctttcaattg ttctttctgg aagactttta aaaaaatata aatatgcata tatatatata1990
aattataaat agattcccca cgcagtgtgg tggcatctct gtacaggtac agttttaaac2050
ggtttgcctc ttttctgtaa gattatggta ctgtggaaca tgagggcaga ggacaccggg2110
aggctgttag ggggtcactg aatcccagga gccaacctcc ccctttgcag ggctgcattt2170
aaaaattagg tttgggacag ttcttgtacc gtggtttcag ccttgtgtgg tcatcactgg2230
cttctggagc tattggtgat gtccaaggga aagctttgag agtttatgtt tactctttga2290
gtcccaggag aagcctggca ccctctttgc aaattggcct ttgctctttc aatgcctttc2350
atccatctcc actctctcaa ctgcctaaag tcacagcaca gatactgccc agtgccttaa2410
gaggagacat gatctctacc agggactctc agcaaacacg ggactgtgtt cagtccacaa2470
aggaaaagcg tttttgaagc tctcattgtt catgtaaaaa tcatacacgt ggcatgttgc2530
tccacattcc ttacacacag gggtagaggg gattgctttt gtgacccacg ttcaaatatg2590
tgactgtttt cttttctctt ttactgctaa gcagcctgga aaggataaat gaatattaga2650
ctaagatttg ttttccagga ggctcaatct gaacacacag aatgtcagag ctggaaggga2710
ctatagagat catctgatct gatcctcttg tacggatgat cgcaaaactg aggtgtagag2770
aggggaatgg ccaaaatcac aaagcaagtt agcgttaaga gctgagacta gaattcaggg2830
tcctcactcc caggccaccg aaccatgcag ccccttcttt gggggaagag acctgtgtca2890
gtcttggtta attgttccag ggaaccttgc taacagaaac ttgctcttgc cttggctctt2950
cagtagatga cctggctgta aagagattcc ctggacgagc cagatcattc agtttcagcg3010
agtccttgag ctccacaaca tctaccagat atagcagaca agcacccatg gaggcaggtt3070
tcgggcctga agcagatcag agggctttgc aaaagacagc atagagccat cttcctgcaa3130
ctttacctct ttccctcaga tggggagcca tgactgggtt gcacctcagg atactgtaat3190
ttgactccat aattgctttt gctcctgaaa cctgggaatc aatggaaagg cagggaatgt3250
gcctcttctg tggccagatt ctgttatttg caattaaagc aagtttttaa aaaatgcaag3310
aggcagttgt tagtcttcag ggcttggcaa ctgaaatagc tatgtggcgg atacggaaaa3370
cagaggacaa tttgaggatc ttgctggaat aataaatgac agctaccatt tgttgagcac3430
ctattatata tcaggcactg agctgggtag gctctaaact tcacaataac cctgtgactt3490
aactacttta tctccatttt gtagttgaag aaataagttc agagagaaag attccttccc3550
aaggtcatgc agctagtaaa tgatagaatc aggattcata gcatcactat agggggtcaa3610
tatttacaca aaaaaggaaa gtcacaagcc tgtttaaaat gaagtgacca ccttttcttg3670
catagactaa ataactcgaa ctggcatttt taggttggaa agacagctga attagtagtt3730
aagtctgata gccaagtaag ttttaaaaac caaagcatcc aggatgcaca cccctgcacc3790
atttgctgtg cgaattaata gttctgtctc tctctctctt tcttttttct ttttattctt3850
tgagatggat tttcgctctt gtcgcccagg ctggagtaca atggcacgat cttggctcac3910
tgcaacctcc gcctcccggg ttcaagcgat tcttctgctg ggattacagc atatgccacc3970
atgcccagat tatttttttg tatttgtagt agagacgggg tttcaccatg tcagtcaggc4030
tggtcttgaa ctcctgacct caggtgatcc acccgcctca gcctcccaca ctgctgggat4090
tacaggcatg agccaccgct cctggcctct ctttcttttt taaacaaaga actttgcact4150
tggccagaga ggaggagaaa gcccattttc tcccttccta agctagatcc aaataaaaga4210
aagttcagtt ttcccccata actattcttg ggtcatgaac tttgatctgg agtttgtttt4270
gtttcaggaa tgtgtgcacc cagcttgctg atccaacaaa gtctattgct taccagtcta4330
gcttgatgaa gccttttggc cagaagtcaa tttgttttgg atcagagaaa tttcctgaca4390
aggtatattt gttttctagt gacagaaagg caaaggaaca agtcctagtt gttgttgttg4450
ttgttgaata ctaaatttaa gatatgtcag cttgctttca atgagccttg ggcttctgtt4510
attgcttgag catttggaac tcgagcttcc agagaaattt gaggtcctcg cttgttctct4570
gccttcaaga aacaatgacc tgattctgtc tttaaaaaaa aaatctcaga attctttttt4630
tgtttgtgtt tttttttttg agacagagtc tcactctgtt gcccaggctg gagtgcagtg4690
gcgccatctc ggctcactgc aacctccgcc tcccaggttc aagcaattct cctgcctcag4750
cctcccaggt agctgccact acaggtgctg caccaccacg cccggctaat ttttgtattt4810
ttagtagaga cagggtttca ccatattagc caggtgggtc ttgaactcct gaccttgtga4870
tccacccgcc tcggcctccc aaagtgctgg gattacaggc gtgagccacc ttgcctggcc4930
aaaaatctca gaattcttta agactgtttt aattgctcca tcagtaattt tgaagcactt4990
tccttttttt ttttcccctt tttgtccctt tccccaagcc accaattgga tggatgaatg5050
tttgacgggg aagaggaagg gtaggaggat gcatggatga gtggatgagt ggatcgatgg5110
atgtattgat aaatagatag aaccagtcat ctgaagcaac ttaagaattg tagccttgac5170
tccttgagac tgtagatttc gatccaggaa acatttattt agcacctgcc agatgccaga5230
aatttatacc atttaaaact cagtaagtct tttaaatatc aggaaggaga gaagcgacat5290
catgatacat cctatgggta ttaaaaagcc aatagaatat tatgaataat tttatgctaa5350
taaatttaac aacttcaaca tcataaacaa attccttgaa aaataaaaag taccaaaatt5410
cattcaagaa gaaatagata ccagcctgag caacatggca aaatcccatc tctacaaaac5470
atcaaaaaaa aaaaattagt cgggcatggt ggtgcacacc tgtaatccca gcttgtcagg5530
aggctgaagt gggaggatca cctgagccca gggaggtcaa ggatgcagtg agccatggtc5590
tcaccactgc actctagcct aggtgacaga atgagacccc gtctcaaaaa aaaagaagaa5650
gtagataatc tgaatagccc tatatctata gaaacttaat agtgctggga gatataggta5710
ttattatcct cattttacag atgtgaaaat tgaggctcag agaagtaaag tctattgctc5770
aaggtcatgt ggctagaata tggcagagcc atgattcaga tccaggtctt ctgattctta5830
ttccagtgtc ctttctagca taccatgttg cctctaaaga ttgcagctcc ttatttacta5890
gaaaattgtt cctgcccaat ctacatctcc acctcacccc atcttttctt aagcactatg5950
tttgtgtttt tatcagtatt atattcattg tctttggaat acatgttctt gtttgtgttt6010
ggaaaaaaaa tctcttttac cagcttgcac tcggaccaac ttggaaaaaa aaagcttaaa6070
tgtttttgct atgtacagtt taaaaatgtg aagtttgtag ctttaacttt ttgtaagaaa6130
atctaataac actggcttaa gtgctgactt gaaatgctat tttgtaaggt ttggatgtaa6190
gtaatcaatt gaggtcagca gtttgtatga gacatagctt cctccattgc ccccactcct6250
tttttctttt ttaagtttga gatgcttcct gtgtttttat gttagaattg ttgttctcct6310
tcttttcttc ttcctatacc tcatcacgtt tgttttaaat aaactgtcct ttggaccaca6370
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 6405
<210>14
<211>462
<212>PRT
<213>智人
<400>14
Met Glu Thr Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys
1 5 10 15
Leu Asp Glu Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val
20 25 30
Leu Glu Lys Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile
35 40 45
His Lys Glu Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu
50 55 60
Ser Asp Leu Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys
65 70 75 80
Asp Ser Pro His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr
85 90 95
Asp Leu Trp Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp
100 105 110
Ile Ile Arg Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr
115 120 125
Ile Leu Gln Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg
130 135 140
Lys Ile His Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu
145 150 155 160
Gly His Ala Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp
165 170 175
Thr Met Ala Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala
180 185 190
Pro Glu Val Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp
195 200 205
Ser Leu Gly Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr
210 215 220
Ala Asp Ile His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro
225 230 235 240
Pro Pro Thr Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp
245 250 255
Phe Val Lys Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala
260 265 270
Thr Gln Leu Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser
275 280 285
Ile Leu Arg Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg
290 295 300
Gln Glu Ser Gln Gln Arg Glu ValAsp Gln Asp Asp Glu Glu Asn Ser
305 310315 320
Glu Glu Asp Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp
325 330 335
Glu Met Gly Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn
340 345 350
Thr Met Ile Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met
355 360 365
Val Ile Asn Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg
370 375 380
Asp Glu Thr Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu
385 390 395 400
Gln Lys Glu Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro
405 410 415
Gly Pro Leu Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp
420 425 430
Tyr Glu Phe Lys Thr Ser Gln Glu Gln Gln Ser Gly Lys Asp Ile Cys
435 440 445
Ile Gln Asn Cys Gln Gly Asn Leu Leu Cys Arg Tyr Ala Phe
450 455 460
<210>15
<211>1931
<212>DNA
<213>智人
<220>
<221>CDS
<222>(43)..(1503)
<223>Mst1/STK4基因
<400>15
cggcacgaga gtgagcgggt ctgggcggct gctggcagcg cc atg gag acg51
Met Glu Thr
1
gta cag ctg agg aac ccg ccg cgc cgg cag ctg aaa aag ttg gat gaa 99
Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys Leu Asp Glu
5 10 15
gat agt tta acc aaa caa cca gaa gaa gta ttt gat gtc tta gag aaa 147
Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val Leu Glu Lys
20 25 30 35
ctt gga gaa ggg tcc tat ggc agc gta tac aaa gct att cat aaa gag 195
Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile His Lys Glu
40 45 50
acc ggc cag att gtt gct att aag caa gtt cct gtg gaa tca gac ctc 243
Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu Ser Asp Leu
55 60 65
cag gag ata atc aaa gaa atc tct ata atg cag caa tgt gac agc cct 291
Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys Asp Ser Pro
70 75 80
cat gta gtc aaa tat tat ggc agt tat ttt aag aac aca gac tta tgg 339
His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr Asp Leu Trp
85 90 95
atc gtt atg gag tac tgt ggg gct ggt tct gta tct gat atc att cga 387
Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp Ile Ile Arg
100 105 110 115
tta cga aat aaa acg tta aca gaa gat gaa ata gct aca ata tta caa 435
Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr Ile Leu Gln
120 125 130
tca act ctt aag gga ctt gaa tac ctt cat ttt atg aga aaa ata cac 483
Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg Lys Ile His
135 140 145
cga gat atc aag gca gga aat att ttg cta aat aca gaa gga cat gca 531
Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu Gly His Ala
150 155 160
aaa ctt gca gat ttt ggg gta gca ggt caa ctt aca gat acc atg gcc 579
Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp Thr Met Ala
165 170 175
aag cgg aat aca gtg ata gga aca cca ttt tgg atg gct cca gaa gtg 627
Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala Pro Glu Val
180 185 190 195
att cag gaa att gga tac aac tgt gta gca gac atc tgg tcc ctg gga 675
Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp Ser Leu Gly
200 205 210
ata act gcc ata gaa atg gct gaa gga aag ccc cct tat gct gat atc 723
Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr Ala Asp Ile
215 220 225
cat cca atg agg gca atc ttc atg att cct aca aat cct cct ccc aca 771
His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro Pro Pro Thr
230 235 240
ttc cga aaa cca gag cta tgg tca gat aac ttt aca gat ttt gtg aaa 819
Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp Phe Val Lys
245 250 255
cag tgt ctt gta aag agc cct gag cag agg gcc aca gcc act cag ctc 867
Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala Thr Gln Leu
260 265 270 275
ctg cag cac cca ttt gtc agg agt gcc aaa gga gtg tca ata ctg cga 915
Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser Ile Leu Arg
280 285 290
gac tta att aat gaa gcc atg gat gtg aaa ctg aaa cgc cag gaa tcc 963
Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg Gln Glu Ser
295 300 305
cag cag cgg gaa gtg gac cag gac gat gaa gaa aac tca gaa gag gat1011
Gln Gln Arg Glu Val Asp Gln Asp Asp Glu Glu Asn Ser Glu Glu Asp
310 315 320
gaa atg gat tct ggc acg atg gtt cga gca gtg ggt gat gag atg ggc1059
Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp Glu Met Gly
325 330 335
act gtc cga gta gcc agc acc atg act gat gga gcc aat act atg att1107
Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn Thr Met Ile
340 345 350 355
gag cac gat gac acg ttg cca tca caa ctg ggc acc atg gtg atc aat1155
Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met Val Ile Asn
360 365 370
gca gag gat gag gaa gag gaa gga act atg aaa aga agg gat gag acc1203
Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg Asp Glu Thr
375 380 385
atg cag cct gcg aaa cca tcc ttt ctt gaa tat ttt gaa caa aaa gaa 1251
Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu Gln Lys Glu
390 395 400
aag gaa aac cag atc aac agc ttt ggc aag agt gta cct ggt cca ctg 1299
Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro Gly Pro Leu
405 410 415
aaa aat tct tca gat tgg aaa ata cca cag gat gga gac tac gag ttt 1347
Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp Tyr Glu Phe
420 425 430 435
ctt aag agt tgg aca gtg gag gac ctt cag aag agg ctc ttg gcc ctg 1395
Leu Lys Ser Trp Thr Val Glu Asp Leu Gln Lys Arg Leu Leu Ala Leu
440 445 450
gac ccc atg atg gag cag gag att gaa gag atc cgg cag aag tac cag 1443
Asp Pro Met Met Glu Gln Glu Ile Glu Glu Ile Arg Gln Lys Tyr Gln
455 460 465
tcc aag cgg cag ccc atc ctg gat gcc ata gag gct aag aag aga cgg 1491
Ser Lys Arg Gln Pro Ile Leu Asp Ala Ile Glu Ala Lys Lys Arg Arg
470 475 480
caa caa aac ttc tgagcaa ggccaggctg tgagggcccc agctccaccc 1540
Gln Gln Asn Phe
485
aggctttggg tgaattctgg atggcttgcc tcatgtttgt tagccagcac ttctgctctg 1600
tcgtctctcc acagcacctt tgtgaactca ggaatgtgcg ccagtgggaa gggctctctt 1660
gacagtcagc gtgccatctt gatgtgtgta tgtacattgg tcaggtatat tatctcaaag 1720
gatttatatt ggcgctttta actcagagtt ttaaacccca ggaacagaga ctcctagttg 1780
agtgatagct gggaaagttt tacattgtct gtttttcttc tcccaatagc tttcaattgt 1840
tctttctgga agacttttaa aaaaatataa atatgcatat atatatataa attataaata 1900
gattccccac gcaggtggtg gcatctctgt a 1931
<210>16
<211>487
<212>PRT
<213>智人
<400>16
Met Glu Thr Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys
1 5 10 15
Leu Asp Glu Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val
20 25 30
Leu Glu Lys Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile
35 40 45
His Lys Glu Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu
50 55 60
Ser Asp Leu Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys
65 70 75 80
Asp Ser Pro His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr
85 90 95
Asp Leu Trp Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp
100 105 110
Ile Ile Arg Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr
115 120 125
Ile Leu Gln Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg
130 135 140
Lys Ile His Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu
145 150 155 160
Gly His Ala Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp
165 170 175
Thr Met Ala Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala
180 185 190
Pro Glu Val Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp
195 200 205
Ser Leu Gly Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr
210 215 220
Ala Asp Ile His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro
225 230 235 240
Pro Pro Thr Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp
245 250 255
Phe Val Lys Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala
260 265 270
Thr Gln Leu Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser
275 280 285
Ile Leu Arg Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg
290 295 300
Gln Glu Ser Gln Gln Arg Glu Val Asp Gln Asp Asp Glu Glu Asn Ser
305 310 315 320
Glu Glu Asp Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp
325 330 335
Glu Met Gly Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn
340 345 350
Thr Met Ile Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met
355 360 365
Val Ile Asn Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg
370 375 380
Asp Glu Thr Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu
385 390 395 400
Gln Lys Glu Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro
405 410 415
Gly Pro Leu Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp
420 425 430
Tyr Glu Phe Leu Lys Ser Trp Thr Val Glu Asp Leu Gln Lys Arg Leu
435 440 445
Leu Ala Leu Asp Pro Met Met Glu Gln Glu Ile Glu Glu Ile Arg Gln
450 455 460
Lys Tyr Gln Ser Lys Arg Gln Pro Ile Leu Asp Ala Ile Glu Ala Lys
465 470 475 480
Lys Arg Arg Gln Gln Asn Phe
485
<210>17
<211>1299
<212>DNA
<213>智人
<220>
<221>CDS
<222>(75)..(572)
<223>克隆no.LBFL306-EF3
<400>17
gcggcggcgg cttctcgagt cctccccgac gcgtcctcta ggccagcgag ccccgcgctc 60
tccggtgacg gacc atg tcg gcg gcg gga gcg ggc gcg ggc gta gag107
Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu
1 5 10
gcg ggc ttc tcc agc gag gag ctg ctc tcg ctc cgt ttc ccg ctg cac 155
Ala Gly Phe Ser Ser Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His
15 20 25
cgc gcc tgc cgc gac ggg gac ctg gcc acg ctc tgc tcg ctg ctg cag 203
Arg Ala Cys Arg Asp Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln
30 35 40
cag aca ccc cac gcc cac ctg gcc tct gag gac tcc ttc tat ggc tgg 251
Gln Thr Pro His Ala His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp
45 50 55
acg ccc gtg cac tgg gcc gcg cat ttc ggc aag ttg gag tgc tta gtg 299
Thr Pro Val His Trp Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val
60 65 70 75
cag ttg gtg aga gcg gga gcc aca ctc aac gtc tcc acc aca cgg tac 347
Gln Leu Val Arg Ala Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr
80 85 90
gcg cag acg cca gcc cac att gca gcc ttt ggg gga cat cct cag tgc 395
Ala Gln Thr Pro Ala His Ile Ala Ala Phe Gly Gly His Pro Gln Cys
95 100 105
ctg gtc tgg ctg att caa gca gga gcc aac att aac aaa ccg gat tgt 443
Leu Val Trp Leu Ile Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys
110 115120
gag ggt gaa act ccc att cac aag gca gct cgc tct ggg agc cta gaa 491
Glu Gly Glu Thr Pro Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu
125 130 135
tgc atc agt gcc ctt gtg gcg aat ggg gct cac gtc gat aac ccc aag 539
Cys Ile Ser Ala Leu Val Ala Asn Gly Ala His Val Asp Asn Pro Lys
140 145 150 155
aaa ggc atc agg gtt ctg gag tgg ttg ttt gag tgacacag cacaaggcct 590
Lys Gly Ile Arg Val Leu Glu Trp Leu Phe Glu
160 165
tgatttcatc atgcttttgc tgtggatgta gtgtagcttg ctgaacaggt ttatttcaca 650
gagcagtgta cattcttgtc ttccagggga acttcaacat ggagttactt ttgatccctc 710
agttttaatt cagtgtctaa agcctgagaa atgccagtgg cctgacagca gcagacattg 770
cacaaaccca gggtttccaa gagtgtgccc agtttctctt gaacctccag aattgtcatc 830
tgaaccattt ctataacaat ggcatcttaa atgggggtca tcagaatgta tttcctaatc 890
atattagtgt gggaacaaat cgaaagagat gcttggaaga ctcagaagac tttggagtaa 950
agaaagctag aactgaaggt gagaccgctt tgcgggtggg aagagcacac ttatttttcc1010
tttctgtaat atgttttctt tttatggctg agcgcacctt cgagatgaga ccttcacttc1070
aggtggtaat gcgcctggtg gattgtgcgg tgacggtgga gatttctcct gtactgccac1130
tgcgaagatg ggacacttaa caaaagggaa tgtgagggaa atactgatgg cccaagtgta1190
aatgtctatg tggaactttt tgagcaccca tgtttacctg ccgtgaatta gattttttaa1250
tttgttgtat ctgtttgaaa tatatctatt aaagaaaaaa aaaaaaaaa1299
<210>18
<211>166
<212>PRT
<213>智人
<400>18
Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu Ala Gly Phe Ser Ser
1 5 10 15
Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His Arg Ala Cys Arg Asp
20 25 30
Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln Gln Thr Pro His Ala
35 40 45
His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp Thr Pro Val His Trp
50 55 60
Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val Gln Leu Val Arg Ala
65 70 75 80
Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr Ala Gln Thr Pro Ala
85 90 95
Hi s Ile Ala Ala Phe Gly Gly His Pro Gln Cys Leu Val Trp Leu Ile
100 105 110
Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys Glu Gly Glu Thr Pro
115 120 125
Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu Cys Ile Ser Ala Leu
130 135 140
Val Ala Asn Gly Ala His Val Asp Asn Pro Lys Lys Gly Ile Arg Val
145 150 155 160
Leu Glu Trp Leu Phe Glu
165
<210>19
<211>2451
<212>DNA
<213>智人
<220>
<221>CDS
<222>(78)..(1337)
<223>克隆no.LBFL306-GC7
<400>19
gctgcggcgg cggcttctcg agtcctcccc gacgcgtcct ctaggccagc gagccccgcg 60
ctctccggtg acggaccatg tcg gcg gcg gga gcg ggc gcg ggc gta gag110
Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu
1 5 10
gcg ggc ttc tcc agc gag gag ctg ctc tcg ctc cgt ttc ccg ctg cac 158
Ala Gly Phe Ser Ser Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His
15 20 25
cgc gcc tgc cgc gac ggg gac ctg gcc acg ctc tgc tcg ctg ctg cag 206
Arg Ala Cys Arg Asp Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln
30 35 40
cag aca ccc cac gcc cac ctg gcc tct gag gac tcc ttc tat ggc tgg 254
Gln Thr Pro His Ala His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp
45 50 55
acg ccc gtg cac tgg gcc gcg cat ttc ggc aag ttg gag tgc tta gtg 302
Thr Pro Val His Trp Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val
60 65 70 75
cag ttg gtg aga gcg gga gcc aca ctc aac gtc tcc acc aca cgg tac350
Gln Leu Val Arg Ala Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr
80 85 90
gcg cag acg cca gcc cac att gca gcc ttt ggg gga cat cct cag tgc398
Ala Gln Thr Pro Ala His Ile Ala Ala Phe Gly Gly His Pro Gln Cys
95 100 105
ctg gtc tgg ctg att caa gca gga gcc aac att aac aaa ccg gat tgt446
Leu Val Trp Leu Ile Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys
110 115 120
gag ggt gaa act ccc att cac aag gca gct cgc tct ggg agc cta gaa494
Glu Gly Glu Thr Pro Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu
125 130 135
tgc atc agt gcc ctt gtg gcg aat ggg gct cac gtc gac ctg aga aat542
Cys Ile Ser Ala Leu Val Ala Asn Gly Ala His Val Asp Leu Arg Asn
140 145 150 155
gcc agt ggc ctg aca gca gca gac att gca caa acc cag ggt ttc caa590
Ala Ser Gly Leu Thr Ala Ala Asp Ile Ala Gln Thr Gln Gly Phe Gln
160 165 170
gag tgt gcc cag ttt ctc ttg aac ctc cag aat tgt cat ctg aac cat638
Glu Cys Ala Gln Phe Leu Leu Asn Leu Gln Asn Cys His Leu Asn His
175 180 185
ttc tat aac aat ggc atc tta aat ggg ggt cat cag aat gta ttt cct686
Phe Tyr Asn Asn Gly Ile Leu Asn Gly Gly His Gln Asn Val Phe Pro
190 195 200
aat cat att agt gtg gga aca aat cga aag aga tgc ttg gaa gac tca734
Asn His Ile Ser Val Gly Thr Asn Arg Lys Arg Cys Leu Glu Asp Ser
205 210 215
gaa gac ttt gga gta aag aaa gct aga act gaa gct caa agc ttg gat782
Glu Asp Phe Gly Val Lys Lys Ala Arg Thr Glu Ala Gln Ser Leu Asp
220 225 230 235
tct gcc gtg cca ctc acg aat ggc gac aca gaa gac gat gct gac aaa830
Ser Ala Val Pro Leu Thr Asn Gly Asp Thr Glu Asp Asp Ala Asp Lys
240 245 250
atg cac gtt gat agg gag ttt gct gtt gta aca gat atg aaa aac agt878
Met His Val Asp Arg Glu Phe Ala Val Val Thr Asp Met Lys Asn Ser
255 260 265
agc tcc gta tcg aat aca ttg aca aat gga tgt gtc atc aat gga cat 926
Ser Ser Val Ser Asn Thr Leu Thr Asn Gly Cys Val Ile Asn Gly His
270 275 280
ttg gac ttc ccc tcc acg acc ccg ctc agt ggg atg gaa agc agg aat 974
Leu Asp Phe Pro Ser Thr Thr Pro Leu Ser Gly Met Glu Ser Arg Asn
285 290 295
ggc cag tgc ttg aca gga act aac gga att agc agt gga tta gcc cca 1022
Gly Gln Cys Leu Thr Gly Thr Asn Gly Ile Ser Ser Gly Leu Ala Pro
300 305 310 315
gga cag ccg ttt ccg agt agc cag ggt tct ctc tgc att agt ggg act 1070
Gly Gln Pro Phe Pro Ser Ser Gln Gly Ser Leu Cys Ile Ser Gly Thr
320 325 330
gag gag cca gag aag acc ctg aga gct aac cct gag ttg tgc ggt tct 1118
Glu Glu Pro Glu Lys Thr Leu Arg Ala Asn Pro Glu Leu Cys Gly Ser
335 340 345
ctg cac ctg aac ggg agt cca agt agc tgc ata gcc agt agg cct tcc 1166
Leu His Leu Asn Gly Ser Pro Ser Ser Cys Ile Ala Ser Arg Pro Ser
350 355 360
tgg gtg gaa gac att ggg gat aac ctg tac tat gga cac tac cac ggg 1214
Trp Val Glu Asp Ile Gly Asp Asn Leu Tyr Tyr Gly His Tyr His Gly
365 370 375
ttt ggg gac act gct gaa agc atc cca gaa ctg aac agt gtg gtc gag 1262
Phe Gly Asp Thr Ala Glu Ser Ile Pro Glu Leu Asn Ser Val Val Glu
380 385 390 395
cat tcc aag tcc gtg aag gtg cag gag cgg tac gac agt gcc gtg ctg 1310
His Ser Lys Ser Val Lys Val Gln Glu Arg Tyr Asp Ser Ala Val Leu
400 405 410
ggc acc atg cac ctg cac cac ggc tcc tag agacgctgac ctggctctcg1360
Gly Thr Met His Leu His His Gly Ser
415 420
gaaacgcagg agtccttcct ggtagccagc tcagaatacc catgtagcag caacttgaac1420
gaatgtcaca acttgtacgt tttttatata cttcaacttt ctgaaaaagt aaacttcgac1480
aagttcccag caactgcttg tttgtgcatg agtagggctt actaagtgca tagatgtttc1540
tacagtgagg tgtccttttt ataaggtgca cttttggagt tcttctgatg ccaatctcaa1600
cattgtcttt ttaatactgt caccagatat tgccattttt ctttttgtta aaagattata1660
tgatcaagat aaattggggt ggtaaatcag gtgcctggta atttatctct ttgcacatgg1720
gcatcatttt aaaaagcttg cttccactct tttctgtaga atttgacgga acacagctat1780
ttccctatgc aaggtacagc cttacaaaga tttctgcagt gatttgtgtg aagaagagaa1840
cgtttgtctt tttcaatgaa gctttgcaga tcaccatgtg gttgaaggtt ttagttgtgg1900
acacagtggt ccctccttaa tgatgaagat cactgccttg ggcttcatgg aaaacaggcc1960
cagcctgggg ctgcgtttgg atttattgtt tttattccac acttcctact tggtctctgg2020
aagttttacc acatgtaaca gattccttta tatgtagtgg aaatcactat ttgtagaaac2080
tgtcaggtca aaatatttaa ctgactgttg acatgtattt tcttttttcc ttgtttttgt2140
tttttagggt tttctgcttt aagatatata ccactatgta tatccagtta actgagagaa2200
ttttgactct cttaataaaa ctgcattaag tttttgattt tgtagaaatt agcttttgtc2260
taggcaacta gtggttatac tctgcaaata ttgtaatgaa tttttacttt tttgattttt2320
gtaataaaaa ttggtgcaga taaaatgtca aatgaacaaa ccagtgttct aagagtgtta2380
ctaacatttt gttctaaaac tgtccttcac aaattgaata aaaaactctc acactcaaaa2440
aaaaaaaaaa a 2451
<210>20
<211>420
<212>PRT
<213>智人
<400>20
Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu Ala Gly Phe Ser Ser
1 5 10 15
Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His Arg Ala Cys Arg Asp
20 25 30
Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln Gln Thr Pro His Ala
35 40 45
His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp Thr Pro Val His Trp
50 55 60
Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val Gln Leu Val Arg Ala
65 70 75 80
Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr Ala Gln Thr Pro Ala
85 90 95
His Ile Ala Ala Phe Gly Gly His Pro Gln Cys Leu Val Trp Leu Ile
100 105 110
Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys Glu Gly Glu Thr Pro
115 120 125
Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu Cys Ile Ser Ala Leu
130 135 140
Val Ala Asn Gly Ala His Val Asp Leu Arg Asn Ala Ser Gly Leu Thr
145 150 155 160
Ala Ala Asp Ile Ala Gln Thr Gln Gly Phe Gln Glu Cys Ala Gln Phe
165 170 175
Leu Leu Asn Leu Gln Asn Cys His Leu Asn His Phe Tyr Asn Asn Gly
180 185 190
Ile Leu Asn Gly Gly His Gln Asn Val Phe Pro Asn His Ile Ser Val
195 200 205
Gly Thr Asn Arg Lys Arg Cys Leu Glu Asp Ser Glu Asp Phe Gly Val
210 215 220
Lys Lys Ala Arg Thr Glu Ala Gln Ser Leu Asp Ser Ala Val Pro Leu
225 230 235 240
Thr Asn Gly Asp Thr Glu Asp Asp Ala Asp Lys Met His Val Asp Arg
245 250 255
Glu Phe Ala Val Val Thr Asp Met Lys Asn Ser Ser Ser Val Ser Asn
260 265 270
Thr Leu Thr Asn Gly Cys Val Ile Asn Gly His Leu Asp Phe Pro Ser
275 280 285
Thr Thr Pro Leu Ser Gly Met Glu Ser Arg Asn Gly Gln Cys Leu Thr
290 295 300
Gly Thr Asn Gly Ile Ser Ser Gly Leu Ala Pro Gly Gln Pro Phe Pro
305 310 315 320
Ser Ser Gln Gly Ser Leu Cys Ile Ser Gly Thr Glu Glu Pro Glu Lys
325 330 335
Thr Leu Arg Ala Asn Pro Glu Leu Cys Gly Ser Leu His Leu Asn Gly
340 345 350
Ser Pro Ser Ser Cys Ile Ala Ser Arg Pro Ser Trp Val Glu Asp Ile
355 360 365
Gly Asp Asn Leu Tyr Tyr Gly His Tyr His Gly Phe Gly Asp Thr Ala
370 375 380
Glu Ser Ile Pro Glu Leu Asn Ser Val Val Glu His Ser Lys Ser Val
385 390 395 400
Lys Val Gln Glu Arg Tyr Asp Ser Ala Val Leu Gly Thr Met His Leu
405 410 415
His His Gly Ser
420
<210>21
<211>1194
<212>DNA
<213>智人
<220>
<221>CDS
<222>(78)..(737)
<223>克隆no.LBFL-306-GE2
<400>21
gctgcggcgg cggcttctcg agtcctcccc gacgcgtcct ctaggccagc gagccccgcg60
ctctccggtg acggaccatg tcg gcg gcg gga gcg ggc gcg ggc gta gag110
Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu
1 5 10
gcg ggc ttc tcc agc gag gag ctg ctc tcg ctc cgt ttc ccg ctg cac 158
Ala Gly Phe Ser Ser Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His
15 20 25
cgc gcc tgc cgc gac ggg gac ctg gcc acg ctc tgc tcg ctg ctg cag206
Arg Ala Cys Arg Asp Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln
30 35 40
cag aca ccc cac gcc cac ctg gcc tct gag gac tcc ttc tat ggc tgg254
Gln Thr Pro His Ala His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp
45 50 55
acg ccc gtg cac tgg gcc gcg cat ttc ggc aag ttg gag tgc tta gtg302
Thr Pro Val His Trp Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val
60 65 70 75
cag ttg gtg aga gcg gga gcc aca ctc aac gtc tcc acc aca cgg tac 350
Gln Leu Val Arg Ala Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr
80 85 90
gcg cag acg cca gcc cac att gca gcc ttt ggg gga cat cct cag tgc 398
Ala Gln Thr Pro Ala His Ile Ala Ala Phe Gly Gly His Pro Gln Cys
95 100 105
ctg gtc tgg ctg att caa gca gga gcc aac att aac aaa ccg gat tgt 446
Leu Val Trp Leu Ile Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys
110 115 120
gag ggt gaa act ccc att cac aag gca gct cgc tct ggg agc cta gaa 494
Glu Gly Glu Thr Pro Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu
125 130 135
tgc atc agt gcc ctt gtg gcg aat ggg gct cac gtc gag ttt att tca 542
Cys Ile Ser Ala Leu Val Ala Asn Gly Ala His Val Glu Phe Ile Ser
140 145 150 155
cag agc agt gta cat tct tgt ctt cca ggg gaa ctt caa cat gga gtt 590
Gln Ser Ser Val His Ser Cys Leu Pro Gly Glu Leu Gln His Gly Val
160 165 170
act ttt gat ccc tca gtt tta att cag tgt cta aag cct gag aaa tgc 638
Thr Phe Asp Pro Ser Val Leu Ile Gln Cys Leu Lys Pro Glu Lys Cys
175 180 185
cag tgg cct gac agc agc aga cat tgc aca aac cca ggg ttt cca aga 686
Gln Trp Pro Asp Ser Ser Arg His Cys Thr Asn Pro Gly Phe Pro Arg
190 195 200
gtg tgc cca gtt tct ctt gaa cct cca gaa ttg tca tct gaa cca ttt 734
Val Cys Pro Val Ser Leu Glu Pro Pro Glu Leu Ser Ser Glu Pro Phe
205 210 215
ctataa caatggcatc ttaaatgggg gtcatcagaa tgtatttcct aatcatatta790
Leu
220
gtgtgggaac aaatcgaaag agatgcttgg aagactcaga agactttgga gtaaagaaag850
ctagaactga aggtgagacc gctttgcggg tgggaagagc acacttattt ttcctttctg910
taatatgttt tctttttatg gctgagcgca ccttcgagat gagaccttca cttcaggtgg970
taatgcgcct ggtggattgt gcggtgacgg tggagatttc tcctgtactg ccactgcgaa 1030
gatgggacac ttaacaaaag ggaatgtgag ggaaatactg atggcccaag tgtaaatgtc1090
tatgtggaac tttttgagca cccatgttta cctgccgtga attagatttt ttaatttgtt1150
gtatctgttt gaaatatatc tattaaagaa aaaaaaaaaa aaaa 1194
<210>22
<211>220
<212>PRT
<213>智人
<400>22
Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu Ala Gly Phe Ser Ser
1 5 10 15
Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu Hi s Arg Ala Cys Arg Asp
20 25 30
Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln Gln Thr Pro His Ala
35 40 45
His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp Thr Pro Val His Trp
50 55 60
Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val Gln Leu Val Arg Ala
65 70 75 80
Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr Ala Gln Thr Pro Ala
85 90 95
His Ile Ala Ala Phe Gly Gly His Pro Gln Cys Leu Val Trp Leu Ile
100 105 110
Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys Glu Gly Glu Thr Pro
115 120 125
Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu Cys Ile Ser Ala Leu
130 135 140
Val Ala Asn Gly Ala His Val Glu Phe Ile Ser Gln Ser Ser Val His
145 150 155 160
Ser Cys Leu Pro Gly Glu Leu Gln His Gly Val Thr Phe Asp Pro Ser
165 170 175
Val Leu Ile Gln Cys Leu Lys Pro Glu Lys Cys Gln Trp Pro Asp Ser
180 185 190
Ser Arg His Cys Thr Asn Pro Gly Phe Pro Arg Val Cys Pro Val Ser
195 200205
Leu Glu Pro Pro Glu Leu Ser Ser Glu Pro Phe Leu
210 215 220
权利要求
1.一种分离的核酸分子,该分离的核酸分子选自(a)含有SEQID NO3,5,7,9,11,13,17或19的分离核酸分子;(b)编码SEQID NO4,14或18的氨基酸序列的分离核酸分子;(c)编码在胃癌中被表达的蛋白并与SEQ ID NO3或17的全长具有至少约92%核苷酸序列相同性的分离核酸分子;(d)编码在胃癌中被表达的蛋白并与SEQID NO13的全长具有至少约95%核苷酸序列相同性的分离核酸分子;(e)含有(a),(b),(c)或(d)的核酸分子的互补链的分离核酸分子。
2.如权利要求1所述的分离的核酸分子,其中所述核酸分子含有SEQ ID NO3的174-584位核苷酸。
3.如权利要求1所述的分离的核酸分子,其中所述核酸分子由SEQ ID NO3的174-584位核苷酸组成。
4.如权利要求1所述的分离的核酸分子,其中所述核酸分子包含SEQ ID NO3的174-587位核苷酸。
5.如权利要求1所述的分离的核酸分子,其中所述核酸分子选自以下由SEQ ID NO5的38-892位核苷酸组成的核酸分子和由SEQID NO5的38-895位核苷酸组成的核酸分子。
6.如权利要求1所述的分离的核酸分子,其中所述核酸分子选自以下由SEQ ID NO7的53-892位核苷酸组成的核酸分子和由SEQID NO7的53-895位核苷酸组成的核酸分子。
7.如权利要求1所述的分离的核酸分子,其中所述核酸分子选自以下由SEQ ID NO9的65-892位核苷酸组成的核酸分子和由SEQID NO9的65-895位核苷酸组成的核酸分子。
8.如权利要求1所述的分离的核酸分子,其中所述核酸分子选自以下由SEQ ID NO11的92-892位核苷酸组成的核酸分子和由SEQ ID NO11的92-895位核苷酸组成的核酸分子。
9.如权利要求1所述的分离的核酸分子,其中所述核酸分子含有SEQ ID NO13的49-1434位核苷酸。
10.如权利要求1所述的分离的核酸分子,其中所述核酸分子由SEQ ID NO13的49-1437位核苷酸组成。
11.如权利要求1所述的分离的核酸分子,其中所述核酸分子含有SEQ ID NO13的49-1437位核苷酸。
12.如权利要求1所述的分离的核酸分子,其中所述核酸分子含有SEQ ID NO17的75-575位核苷酸。
13.如权利要求1所述的分离的核酸分子,其中所述核酸分子由SEQ ID NO17的75-575位核苷酸组成。
14.如权利要求1所述的分离的核酸分子,其中所述核酸分子含有SEQ ID NO17的75-572位核苷酸。
15.如权利要求1-14中任一项所述的分离的核酸分子,其中所述核酸分子与一个或多个表达控制元件进行可操作性的连接。
16.一种含有权利要求1-14中任一项所述的分离的核酸分子的载体。
17.一种被转化而含有权利要求1-14中任一项所述的核酸分子的宿主细胞。
18.一种含有权利要求16的载体的宿主细胞。
19.如权利要求18所述的宿主细胞,其中所述宿主细胞选自原核宿主细胞和真核宿主细胞。
20.一种用于生产多肽或蛋白的方法,包括在由核酸编码的所述多肽或蛋白表达的条件下培养被权利要求1-14中任一项所述的核酸分子转化的宿主细胞。
21.如权利要求20所述的方法,其中所述宿主细胞选自原核宿主细胞和真核宿主细胞。
22.一种由权利要求21所述的方法生产的分离的多肽或蛋白。
23.一种分离的多肽或蛋白,选自以下(a)含SEQ ID NO4,6,8,10,12,14或18的氨基酸序列的分离多肽或蛋白;(b)与SEQ IDNO4具有至少约92%氨基酸序列相同性的分离多肽或蛋白;(c)由SEQID NO4的31-137位氨基酸组成的分离多肽或蛋白;(d)含SEQ ID NO6,8,10或12的至少10个氨基酸的片段的分离多肽;(e)含SEQ IDNO6,8,10或12的保守氨基酸取代物的分离多肽;(f)含SEQ ID NO6,8,10或12的自然存在的氨基酸序列变异体的分离多肽;(g)与SEQID NO6,8,10或12具有至少约75%氨基酸序列相同性的分离多肽;(h)与SEQ ID NO14具有至少约95%氨基酸序列相同性的分离多肽或蛋白;和(i)与SEQ ID NO18具有至少约92%氨基酸序列相同性的分离多肽或蛋白。
24.一种与权利要求23所述的多肽或蛋白结合的或与含有SEQ IDNO2的氨基酸序列的分离多肽或蛋白结合的分离的抗体或抗原-结合型抗体片段。
25.如权利要求24所述的抗体,其中所述抗体是单克隆或多克隆抗体。
26.调控编码权利要求23的蛋白、含SEQ ID NO2,20或22所示氨基酸序列的蛋白、或Mst1蛋白或Mst1剪接变体蛋白的核酸分子表达的介质的鉴定方法,该方法包括
使表达所述核酸的细胞与所述介质接触;和
确定所述介质是否调控所述核酸的表达,从而鉴定出调控编码所述蛋白的核酸分子的表达的介质。
27.调控权利要求23的蛋白、含SEQ ID NO2,20或22所示氨基酸序列的蛋白、或Mst1蛋白或Mst1剪接变体蛋白的水平或至少一种活性的介质的鉴定方法,该方法包括
使表达所述蛋白的细胞与所述介质接触;和
确定所述介质是否调控所述蛋白的水平或至少一种活性,从而鉴定出调控所述蛋白的水平或至少一种活性的介质。
28.如权利要求27的方法,其中所述介质调控所述蛋白的一种活性。
29.一种鉴定权利要求23的蛋白或含SEQ ID NO2所示氨基酸序列的蛋白的结合配偶体的方法,该方法包括以下步骤
使所述蛋白与潜在的结合配偶体接触;和
确定所述潜在的结合配偶体是否与所述蛋白结合,从而鉴定出所述蛋白的结合配偶体。
30.对编码权利要求23的蛋白、含SEQ ID NO2,20或22所示氨基酸序列的蛋白、或Mst1蛋白或Mst1剪接变体蛋白的核酸分子的表达进行调控的方法,该方法包括以下步骤
施用有效量的调控编码所述蛋白的核酸分子的表达的介质。
31.对权利要求23的蛋白、含SEQ ID NO2,20或22所示氨基酸序列的蛋白、或Mst1蛋白或Mst1剪接变体蛋白的至少一种活性进行调控的方法,该方法包括以下步骤
施用有效量的调控所述蛋白的至少一种活性的介质。
32.一种经修饰而含有权利要求1-14中的任一项所述的核酸分子的非人类转基因动物。
33.如权利要求32所述的转基因动物,其中所述核酸分子含有防止被编码蛋白进行表达的突变。
34.在受试者中诊断疾病状态的方法,包括
确定权利要求1-14中的任一项所述的核酸分子或编码Mst1蛋白或Mst1剪接变体蛋白的核酸分子的表达水平,或者确定权利要求23的蛋白或含SEQ ID NO2,20或22所示氨基酸序列的蛋白或Mst1蛋白或Mst1剪接变体蛋白的表达水平。
35.如权利要求34所述的方法,其中所述疾病状态是胃癌。
36.如权利要求34所述的方法,其中所述疾病状态是晚期胃癌。
37.如权利要求34所述的方法,其中所述疾病状态是恶性肿瘤。
38.如权利要求37所述的方法,其中所述恶性肿瘤发生在软组织、骨头、乳房、子宫颈、结肠、子宫内膜、食道、肾、喉、肝脏、肺、网膜、卵巢、胰腺、直肠、甲状腺、子宫肌层、前列腺、皮肤、小肠、膀胱、脾或胃。
39.如权利要求16-21或24-25中任一项所述的方法,其中所述剪接变体是SEQ ID NO13或SEQ ID NO14。
40.含有稀释剂和多肽或蛋白的组合物,其中所述多肽或蛋白选自以下(a)含SEQ ID NO4,6,8,10,12,14,18,20或22所示氨基酸序列的分离多肽或蛋白;(b)与SEQ ID NO4或18具有至少约92%氨基酸序列相同性的分离多肽或蛋白;(c)由SEQ ID NO4的31-137位氨基酸组成的分离多肽或蛋白;(d)含SEQ ID NO6,8,10或12的至少10个氨基酸的片段的分离多肽;(e)含SEQ ID NO6,8,10或12的保守氨基酸取代物的分离多肽;(f)含SEQ ID NO6,8,10或12的自然存在的氨基酸序列变异体的分离多肽;(g)与SEQ ID NO6,8,10或12具有至少约75%氨基酸序列相同性的分离多肽;(h)与SEQ ID NO14具有至少约95%氨基酸序列相同性的分离多肽。
全文摘要
本发明一般涉及胃癌中的基因表达的变化。本发明具体涉及对应于mRNA的人类基因家族,所述mRNA在癌性胃组织和正常胃组织中进行差异表达。
文档编号C07K14/47GK1681835SQ0382197
公开日2005年10月12日 申请日期2003年8月14日 优先权日2002年8月14日
发明者高祥锡, 刘晴, 郑贤镐, 曾文, 李福万, 宋始英 申请人:株式会社Lg生命科学