人类原癌基因及其编码的蛋白质的制作方法

文档序号：3557690阅读：885来源：国知局

专利名称：人类原癌基因及其编码的蛋白质的制作方法
技术领域：
本发明涉及一种表现出诱导癌发生和癌转移能力的新的原癌基因及其编码的蛋白质。

背景技术：
通常，已知高等动物，包括人，具有大约30,000个基因，但每个个体中只能表达大约15％的基因。因此，发现根据被选择和表达的基因决定所有生命现象，即发育、分化、稳态、对刺激的反应、细胞周期控制、老化和细胞凋亡(程序性细胞死亡)等(Liang，P.和A.B.Pardee，Science 257967-971，1992)。
病理现象如肿瘤发生由遗传变异引起，其导致基因表达的改变。因此，不同细胞间基因表达的比较被认为是理解多种生物学机制的基础和根本方法。
例如，由Liang和Pardee提出的mRNA差异显示方法(Liang，P和A.B.Pardee，参见上述参考文献)已经有效用于寻找肿瘤抑制基因、与细胞周期调控有关的基因和与细胞凋亡有关的转录调节基因等，并还广泛用于确定在单个细胞出现的多种基因之间的关系。
将肿瘤发生的多种起因综合起来，有报道称例如特定染色体杂合性的丢失、原癌基因的激活和包括p53基因的其它肿瘤抑制基因的失活的多种遗传改变在肿瘤组织内积累，导致人类肿瘤的形成(Bishop，J.M.，Cell 64235-248，1991；Hunter，T.，Cell 64249-270，1991)。同样，有报道称10～30％的癌症是由原癌基因通过原癌基因的扩增而激活从而诱导的。
原癌基因的激活在多种癌症的病因学研究中起着重要的作用，因此，人们已经进行了尝试以确定该作用。
因此，本发明人发现在原癌基因水平研究产生乳腺癌的机制，因此称为人类增殖诱导基因(PIG)(proliferation inducing gene)的原癌基因，只在癌细胞中表现出特定升高的表达水平。该原癌基因可以有效地用于诊断、预防和治疗如乳腺癌、白血病、子宫癌、恶性淋巴瘤等的多种癌症。

发明内容
因此，设计本发明以解决现有技术的问题，因此本发明的目的是提供一种原癌基因或其片段。
本发明的另一目的是提供一种包含上述原癌基因或其片段的重组载体；和用该重组载体转化的微生物。
本发明的又一目的是提供由上述原癌基因编码的蛋白质；或其片段。
本发明的又一目的是提供一种用于诊断癌症，包括所述原癌基因或其片段的试剂盒。
本发明的再一目的是提供一种用于诊断癌症，包括所述蛋白质或其片段的试剂盒。
为了完成上述目的之一，本发明提供了具有DNA序列的原癌基因及其片段，该DNA序列选自由SEQ ID NO1；SEQ ID NO5；SEQ ID NO9；SEQID NO13；SEQ ID NO17；SEQ ID NO21；SEQ ID NO25；SEQ ID NO29；SEQ ID NO33；SEQ ID NO37；SEQ ID NO41；SEQ ID NO45；SEQ ID NO49；SEQ ID NO53；SEQ ID NO57；SEQ ID NO61；SEQ ID NO65；SEQID NO69；SEQ ID NO73；SEQ ID NO77和SEQ ID NO81组成的组。
根据上述另一目的，本发明提供一种包含上述原癌基因或其片段的重组载体；和用该重组载体转化的微生物。
根据上述又一目的，本发明提供含有氨基酸序列的蛋白质及其片段，该氨基酸序列选自由SEQ ID NO2；SEQ ID NO6；SEQ ID NO10；SEQ ID NO14；SEQ ID NO18；SEQ ID NO22；SEQ ID NO26；SEQ ID NO30；SEQID NO34；SEQ ID NO38；SEQ ID NO42；SEQ ID NO46；SEQ ID NO50；SEQ ID NO54；SEQ ID NO58；SEQ ID NO62；SEQ ID NO66；SEQ ID NO70；SEQ ID NO74；SEQ ID NO78和SEQ ID NO82组成的组，该蛋白质及其片段分别由上述原癌基因编码。
根据上述又一目的，本发明提供一种包括上述原癌基因或其片段的用于诊断癌症的试剂盒。
根据上述再一目的，本发明提供一种包括上述原癌蛋白或其片段的用于诊断癌症的试剂盒。
下文，参照附图将详细描述本发明的优选实施方式。
1.PIG12 本发明的原癌基因，人类增殖诱导基因12(PIG 12)(下文，称为PIG 12原癌基因)具有SEQ ID NO1示出的1,258-bp的全长DNA序列。
在SEQ ID NO1的DNA序列中，对应于68-1,252核苷酸序列位置的可读框(1,250-1,252终止密码子)是全长蛋白质编码区，来自该蛋白质编码区的氨基酸序列示于SEQ ID NO2且包含394个氨基酸(“PIG12蛋白质”)。
由本发明的原癌基因表达的蛋白质含有394个氨基酸，且具有示于SEQID NO2的氨基酸序列，且分子量大约为46KDa。
2.PIG18 本发明的原癌基因，人类增殖诱导基因18(PIG 18)(下文，称为PIG 18原癌基因)具有SEQ ID NO5示出的1,024-bp的全长DNA序列。
在SEQ ID NO5的DNA序列中，对应于875-1,063核苷酸序列位置的可读框(1,061-1,063终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO6且包含62个氨基酸(下文称为“PIG18A蛋白质”)。
SEQ ID NO5的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存，收录号为AY771596(预定发布日期2005年12月31日)，且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号为NM_001992的人类凝血因子II(凝血酶)受体(F2R)基因的相似。但是，由此研究结果发现PIG18原癌基因在包括子宫癌的多种人类肿瘤中高表达，而在多种正常组织中其表达明显降低。
由本发明的原癌基因表达的蛋白质含有62个氨基酸，且具有示于SEQ IDNO6的氨基酸序列，且分子量大约为7KDa。
3.PIG23 本发明的原癌基因，人类增殖诱导基因23(PIG23)(下文，称为PIG 23原癌基因)具有SEQ ID NO9示出的2,150-bp的全长DNA序列。
在SEQ ID NO9的DNA序列中，对应于25-1,953核苷酸序列位置的可读框(1,951-1,953终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO10且包含642个氨基酸(下文称为“PIG23蛋白质”)。
SEQ ID NO9的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存，收录号为AY826819(预定发布日期2005年12月31日)，且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号为NM_016166的人类活化的STAT的抑制蛋白(PIAS1)基因的相似。但是，由此研究结果发现PIG23原癌基因在包括子宫癌的多种人类肿瘤中高表达，而在多种正常组织中其表达明显降低。
由本发明的原癌基因表达的蛋白质含有642个氨基酸，且具有示于SEQID NO10的氨基酸序列，且分子量大约为70KDa。
4.PIG27 本发明的原癌基因，人类增殖诱导基因27(PIG27)(下文，称为PIG 27原癌基因)具有SEQ ID NO13示出的446-bp的全长DNA序列。
在SEQ ID NO13的DNA序列中，对应于20-337核苷酸序列位置的可读框(335-337终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO14且包含105个氨基酸(下文称为“PIG27蛋白质”)。
SEQ ID NO13的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存，收录号为AY453399(预定发布日期2005年12月31日)，且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号为CR456487的人类DNAL4全长可读框(ORF)cDNA克隆基因等的相似。这些基因的功能还是未知的。但是，由此研究结果发现PIG27原癌基因在包括子宫癌的多种人类肿瘤中高表达，而在多种正常组织中其表达明显降低。
由本发明的原癌基因表达的蛋白质含有105个氨基酸，且具有示于SEQID NO14的氨基酸序列，且分子量大约为12KDa。
5.PIG28 本发明的原癌基因，人类增殖诱导基因28(PIG28)(下文，称为PIG 28原癌基因)具有SEQ ID NO17示出的1,024-bp的全长DNA序列。
在SEQ ID NO17的DNA序列中，对应于33-998核苷酸序列位置的可读框(996-998终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO18且包含321个氨基酸(下文称为“PIG28蛋白质”)。
SEQ ID NO17的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存，收录号为AY453398(预定发布日期2005年3月31日)，且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号分别为NM_001153和BC000182的人类膜联蛋白A4(ANXA4)基因和人类膜联蛋白A4基因的相似。但是，由此研究结果发现PIG28原癌基因在包括子宫癌的多种人类肿瘤中高表达，而在多种正常组织中其表达明显降低。
由本发明的原癌基因表达的蛋白质含有321个氨基酸，且具有示于SEQID NO18的氨基酸序列，且分子量大约为36KDa。
6.PIG30 本发明的原癌基因，人类增殖诱导基因30(PIG30)(下文，称为PIG 30原癌基因)具有SEQ ID NO21示出的2,152-bp的全长DNA序列。
在SEQ ID NO21的DNA序列中，对应于6-2,150核苷酸序列位置的可读框(2,148-2,150终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO22且包含714个氨基酸(PIG30蛋白质)。
由本发明的原癌基因表达的蛋白质含有714个氨基酸，且具有示于SEQID NO22的氨基酸序列，且分子量大约为82KDa。
7.PIG31 本发明的原癌基因，人类增殖诱导基因31(PIG31)(下文，称为PIG 31原癌基因)具有SEQ ID NO25示出的2,246-bp的全长DNA序列。
在SEQ ID NO25的DNA序列中，对应于37-2,232核苷酸序列位置的可读框(2,230-2,232终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO26且包含731个氨基酸(PIG31蛋白质)。
由本发明的原癌基因表达的蛋白质含有731个氨基酸，且具有示于SEQID NO26的氨基酸序列，且分子量大约为83KDa。
8.PIG38 本发明的原癌基因，人类增殖诱导基因38(PIG38)(下文，称为PIG 38原癌基因)具有SEQ ID NO29示出的1,973-bp的全长DNA序列。
在SEQ ID NO29的DNA序列中，对应于25-1,956核苷酸序列位置的可读框(1,954-1,956终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO30且包含643个氨基酸(PIG38蛋白质)。
由本发明的原癌基因表达的蛋白质含有643个氨基酸，且具有示于SEQID NO30的氨基酸序列，且分子量大约为73KDa。
9.PIG40 本发明的原癌基因，人类增殖诱导基因40(PIG40)(下文，称为PIG 40原癌基因)具有SEQ ID NO33示出的1,586-bp的全长DNA序列。
在SEQ ID NO33的DNA序列中，对应于36-1,541核苷酸序列位置的可读框(1,539-1,541终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO34且包含501个氨基酸(下文称为“PIG40蛋白质”)。
SEQ ID NO33的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存，收录号为AY762100(预定发布日期2005年12月31日)，且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号为NM_001349的天冬氨酰-tRNA合成酶(DARS)基因等的相似。但是，由此研究结果发现PIG40原癌基因在包括白血病的多种人类肿瘤中高表达，而在多种正常组织中其表达明显降低。
由本发明的原癌基因表达的蛋白质含有501个氨基酸，且具有示于SEQID NO34的氨基酸序列，且分子量大约为57KDa。
10.PIG43 本发明的原癌基因，人类增殖诱导基因43(PIG43)(下文，称为PIG 43原癌基因)具有SEQ ID NO37示出的1,245-bp的全长DNA序列。
在SEQ ID NO37的DNA序列中，对应于57-758核苷酸序列位置的可读框(756-758终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO38且包含233个氨基酸(下文称为“PIG43蛋白质”)。
由本发明的原癌基因表达的蛋白质含有233个氨基酸，且具有示于SEQID NO38的氨基酸序列，且分子量大约为26KDa。但是，在不影响蛋白质功能的范围内，可以取代、添加或去除所述蛋白质的氨基酸序列中的一个或多个氨基酸，并且根据其用途可以只使用一些蛋白质。这样修饰的氨基酸序列同样包括在本发明的范围内。因此，本发明也包括具有与致癌蛋白基本相同的氨基酸序列的多肽；及其片段。术语“基本相同的多肽”是指具有至少80％，优选至少90％，且最优选至少95％的序列同源性的多肽。
11.PIG44 本发明的原癌基因，人类增殖诱导基因44(PIG44)(下文，称为PIG 44原癌基因)具有SEQ ID NO41示出的1,721-bp的全长DNA序列。
在SEQ ID NO41的DNA序列中，对应于55-1,512核苷酸序列位置的可读框(1,510-1,512终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO42且包含485个氨基酸(PIG44蛋白质)。
由本发明的原癌基因表达的蛋白质含有485个氨基酸，且具有示于SEQID NO42的氨基酸序列，且分子量大约为55KDa。
12.PIG46 本发明的原癌基因，人类增殖诱导基因46(PIG46)(下文，称为PIG 46原癌基因)具有SEQ ID NO45示出的1,312-bp的全长DNA序列。
在SEQ ID NO45的DNA序列中，对应于5-1,297核苷酸序列位置的可读框(1,295-1,297终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO46且包含430个氨基酸(PIG46蛋白质)。
由本发明的原癌基因表达的蛋白质含有430个氨基酸，且具有示于SEQID NO46的氨基酸序列，且分子量大约为48KDa。
13.PIG47 本发明的原癌基因，人类增殖诱导基因47(PIG47)(下文，称为PIG 47原癌基因)具有SEQ ID NO49示出的827-bp的全长DNA序列。
在SEQ ID NO49的DNA序列中，对应于56-826核苷酸序列位置的可读框(824-826终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO50且包含256个氨基酸(PIG47蛋白质)。
由本发明的原癌基因表达的蛋白质含有256个氨基酸，且具有示于SEQID NO50的氨基酸序列，且分子量大约为29KDa。
14.PIG48 本发明的原癌基因，人类增殖诱导基因48(PIG48)(下文，称为PIG 48原癌基因)具有SEQ ID NO53示出的1,707-bp的全长DNA序列。
在SEQ ID NO53的DNA序列中，对应于57-1,694核苷酸序列位置的可读框(1,692-1,694终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO54且包含545个氨基酸(PIG48蛋白质)。
由本发明的原癌基因表达的蛋白质含有545个氨基酸，且具有示于SEQID NO54的氨基酸序列，且分子量大约为60KDa。
15.PIG50 本发明的原癌基因，人类增殖诱导基因50(PIG50)(下文，称为PIG 50原癌基因)具有SEQ ID NO57示出的643-bp的全长DNA序列。
在SEQ ID NO57的DNA序列中，对应于2-595核苷酸序列位置的可读框(593-595终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO58且包含197个氨基酸(PIG50蛋白质)。
由本发明的原癌基因表达的蛋白质含有197个氨基酸，且具有示于SEQID NO58的氨基酸序列，且分子量大约为22KDa。
16.PIG54 本发明的原癌基因，人类增殖诱导基因54(PIG54)(下文，称为PIG 54原癌基因)具有SEQ ID NO61示出的1,936-bp的全长DNA序列。
在SEQ ID NO61的DNA序列中，对应于38-1,840核苷酸序列位置的可读框(1,838-1,840终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO62且包含600个氨基酸(PIG54蛋白质)。
由本发明的原癌基因表达的蛋白质含有600个氨基酸，且具有示于SEQID NO62的氨基酸序列，且分子量大约为69KDa。
17.PIG55 本发明的原癌基因，人类增殖诱导基因55(PIG55)(下文，称为PIG 55原癌基因)具有SEQ ID NO65示出的526-bp的全长DNA序列。
在SEQ ID NO65的DNA序列中，对应于15-485核苷酸序列位置的可读框(483-485终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO66且包含156个氨基酸(PIG55蛋白质)。
由本发明的原癌基因表达的蛋白质含有156个氨基酸，且具有示于SEQID NO66的氨基酸序列，且分子量大约为18KDa。
18.GIG9 本发明的原癌基因，人类原癌基因GIG9具有SEQ ID NO69示出的1,008-bp的全长DNA序列。
在SEQ ID NO69的DNA序列中，对应于1-1,008核苷酸序列位置的可读框(1006-1008终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO70且包含335个氨基酸(下文称为“GIG9蛋白质”)。
SEQ ID NO69的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存，收录号为AY453396(预定发布日期2005年3月31日)，且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号为NM_016930的人类突触融合蛋白(STX18)基因的相似。但是，由此研究结果发现GIG9原癌基因在包括子宫癌的多种人类肿瘤中高表达，而在多种正常组织中其表达明显降低。
由本发明的原癌基因表达的蛋白质含有335个氨基酸，且具有示于SEQID NO70的氨基酸序列，且分子量大约为38KDa。
19.HLC-9 本发明的原癌基因，人肺癌相关基因9(下文，称为HLC9原癌基因)具有SEQ ID NO73示出的1,382-bp的全长DNA序列。
在SEQ ID NO73的DNA序列中，对应于27-1,370核苷酸序列位置的可读框(1,368-1,370终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO74且包含447个氨基酸(下文称为“HLC9蛋白质”)。
SEQ ID NO73的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存，收录号为AY189686(预定发布日期2004年5月1日)，且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号为NM_002717的人类蛋白质磷酸酶2(以前为2A)调节亚基B(PR 52)α亚型(PPP2R2A)(proteinphosphotase 2(formerly 2A)，regulatory subunit B(PR52)，α-isoform(PPP2R2A))基因的相似。但是，由此研究结果发现HLC9原癌基因在包括肺癌的多种人类肿瘤中高表达，而在多种正常组织中其表达明显降低。
由本发明的原癌基因HLC9表达的蛋白质含有447个氨基酸，且具有示于SEQ ID NO74的氨基酸序列，且分子量大约为51KDa。
20.GIG18 本发明的原癌基因，GIG18基因(下文，称为GIG18原癌基因)具有SEQ IDNO77示出的1,301-bp的全长DNA序列。
在SEQ ID NO77的DNA序列中，对应于3-1,244核苷酸序列位置的可读框(1,242-1,244终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO78且包含413个氨基酸(GIG18蛋白质)。
由本发明的原癌基因表达的蛋白质含有413个氨基酸，且具有示于SEQID NO78的氨基酸序列，且分子量大约为46KDa。
21.MIG22 本发明的原癌基因，人类转移诱导基因(migration-inducinggene)14(MIG22)(下文，称为MIG22原癌基因)具有SEQ ID NO81示出的749-bp的全长DNA序列。
在SEQ ID NO81的DNA序列中，对应于15-734核苷酸序列位置的可读框(732-734终止密码子)是全长蛋白质编码区，且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO82且包含239个氨基酸(下文称为“MIG22蛋白质”)。
SEQ ID NO81的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存，收录号为AY771595(预定发布日期2005年12月31日)，且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号分别为D45248和BC072025的基因的相似。与以前报道的RAE1基因的功能相反，但是，由此研究结果发现MIG22原癌基因在包括肺癌的多种人类肿瘤中高表达，而在多种正常组织中其表达明显降低。
由本发明的原癌基因表达的蛋白质含有239个氨基酸，且具有示于SEQID NO82的氨基酸序列，且分子量大约为27KDa。
同时，由于密码子的简并性，或考虑到生物表达原癌基因的密码子偏爱性，可以对本发明的原癌基因在编码区进行多种修饰而不改变由该编码区表达的致癌蛋白的氨基酸序列，也可以对除编码区外的区域在不影响基因表达的范围内进行多种修饰或变化。这样修饰的基因同样包括在本发明的范围内。因此，本发明也包括具有与上述原癌基因基本相同的DNA序列的多核苷酸；及其片段。术语“基本相同的多核苷酸”是指具有至少80％、优选至少90％且最优选至少95％的序列同源性的DNA序列。
同样，在不影响蛋白质功能的范围内，甚至可以在本发明的蛋白质的氨基酸序列内取代、添加或缺失一个或多个氨基酸，并且根据其用途可以只使用一些蛋白质。这样修饰的氨基酸序列同样包括在本发明的范围内。因此，本发明也包括具有与致癌蛋白基本相同的氨基酸序列的多肽；及其片段。术语“基本相同的多肽”是指具有至少80％、优选至少90％且最优选至少95％的序列同源性的多肽。
本发明的原癌基因和蛋白质可以从人类癌症组织中分离，或者通过已知的合成DNA或肽的方法合成。同样，可以将如此制备的基因插入到本领域中已知的用于在微生物内表达的载体中，以获得表达载体，接着将表达载体导入合适的宿主细胞，例如大肠杆菌(Escherichia coli)、酵母细胞等。本发明基因的DNA可以大量复制或者其蛋白可以在这样的转化宿主内以商品化数量产生。例如，通过将PIG全长cDNA插入到表达载体pBAD/Thio-Topo(Invitrogen，美国)，接着用得到的表达载体转化大肠杆菌DH5α而在本发明中可以得到转化体。
在构建表达载体时，根据产生原癌基因或蛋白质的宿主细胞的种类可以适当选择和组合表达调控序列，如启动子和终止子、自主复制序列、分泌信号等。
由于在如RNA印迹法等的分析方法中显示本发明的基因在正常乳腺组织中几乎不表达，但其在乳腺癌组织和乳腺癌细胞系中过表达，因此本发明的基因被证明是能诱发乳腺癌的强癌基因。除了如乳腺癌的上皮组织，本发明的原癌基因在其他癌性肿瘤如乳腺癌、白血病、子宫癌、恶性淋巴瘤等中高表达。因此，本发明的原癌基因被认为是在多种肿瘤发生中的共同的癌基因，其可以有效地用于多种癌症的诊断，产生转化动物及用于反义基因治疗等。
例如，使用原癌基因诊断癌症的方法包括步骤在使用全部或部分原癌基因作为探针与由个体体液中提取的核酸杂交后，通过使用多种本领域已知的方法检测原癌基因，以此来检测个体中是否具有本发明的原癌基因。使用放射性同位素、酶等标记的探针可以容易地确定组织样本中所述基因的存在。因此，本发明提供包括全部或一些所述原癌基因的用于诊断癌症的试剂盒。
可以通过将本发明的原癌基因导入例如如鼠的啮齿类动物的哺乳动物来获得转化的动物，优选在至少8-细胞阶段之前的受精卵阶段导入该原癌基因。这样培育的转化动物可以有效地用于寻找致癌物质或如抗氧化剂的抗癌物质。
来自本发明的原癌基因的蛋白质可以有效地作为诊断工具以产生抗体。使用本发明的原癌基因表达的蛋白质或其片段，根据本领域已知的常规方法可以制备为单克隆或多克隆抗体的本发明的抗体，其中所述的蛋白质具有选自由SEQ ID NO2；SEQ ID NO6；SEQ ID NO10；SEQ ID NO14；SEQ IDNO18；SEQ ID NO22；SEQ ID NO26；SEQ ID NO30；SEQ ID NO34；SEQID NO38；SEQ ID NO42；SEQ ID NO46；SEQ ID NO50；SEQ ID NO54；SEQ ID NO58；SEQ ID NO62；SEQ ID NO66；SEQ ID NO70；SEQ ID NO74；SEQ ID NO78和SEQ ID NO82组成的组的氨基酸序列。因此，通过使用本领域中已知的方法，例如酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、夹心法测定、聚丙烯酰胺凝胶上的蛋白质印迹法或免疫印迹法等，来确定受试者体液样品中是否表达该蛋白质，由此那些抗体可以用于诊断癌症。
同样，本发明的原癌基因可以用于建立不受控制生长的癌细胞系，例如该细胞系可以使用用原癌基因转染的成纤维细胞而由在裸鼠背上生长产生的肿瘤组织来产生。该癌细胞系可以有效用于寻找抗癌剂等。
以下，将参考优选实施例对本发明进行详细描述，但这里提出的描述仅是为了对优选实施例进行举例说明，无意对发明的范围进行限制。

参照附图，在下面的详细描述中，将更全面地描述本发明的优选实施方式的这些和其它特征、技术方案和优点。在图中图1～21为示出差异显示反转录聚合酶链式反应(DDRT-PCR)结果的图，用以确定FC21(图1)、FC23(图6)、FC34(图7)、FC24(图12)、FC54(图13)、FC71(图14)、BBCC5-5(图15)和FC4(图17)是否分别在正常乳腺组织、乳腺癌瘤组织和MCF-7癌细胞中表达；MC113DNA片段(图2)、CA338d DNA片段(图3)、H124DNA片段(图4)、H122DNA片段(图5)和H148DNA片段(图18)是否分别在正常外宫颈(exocervical)组织、子宫颈癌组织、淋巴结转移性癌组织(metastatic lymph node tumor tissue)和CUMC-6癌细胞中表达；HP103(图8)、HP11(图10)、HP23(图11)、HP15(图16)和HP47(图20)是否分别在正常肝组织、肝癌组织和HepG2肝癌细胞中表达；GV11DNA片段(图9)是否在正常外周血白细胞组织、白血病组织和K562白血病细胞系中表达；以及L738(图19)和L690(图21)是否分别在正常肺组织、左肺癌组织、从左肺转移到右肺的转移性肺癌组织和A549肺癌细胞中表达。
图22～42为示出用以确定PIG12(图22)、PIG30(图27)、PIG31(图28)、PIG46(图33)、PIG47(图34)、PIG48(图35)、PIG50(图36)和PIG55(图38)原癌基因是否分别在乳腺癌组织表达；PIG18(图23)、PIG23(图24)、PIG27(图25)、PIG28(图26)和GIG9(图39)原癌基因是否分别在正常外宫颈组织、子宫癌组织、宫颈部淋巴结转移性癌组织(metastatic cervical lymph nodetumor tissue)和子宫颈癌细胞系表达；PIG38(图29)、PIG43(图31)、PIG44(图32)、PIG54(图37)、GIG18(图41)原癌基因是否在正常人肝、肝癌和肝癌细胞系表达；PIG40(图30)原癌基因是否在正常外周血白细胞组织、白血病组织和K562白血病细胞系表达；以及HLC9(图40)和MIG22(图42)原癌基因是否分别在正常肺组织、左肺癌组织、从左肺转移到右肺的转移性肺癌组织和A549、NCI-H2009和NCI-H441肺癌细胞系表达的RNA印迹结果的图；并且图22～42下部为分别示出使与图22～42上部相同的样品和β-肌动蛋白探针杂交得到的RNA印迹结果的图。
图43～63为示出用以确定PIG12(图43)、PIG18(图44)、PIG23(图45)、PIG27(图46)、PIG28(图47)、PIG30(图48)、PIG31(图49)、PIG38(图50)、PIG40(图51)、PIG43(图52)、PIG44(图53)、PIG46(图54)、PIG47(图55)、PIG48(图56)、PIG50(图57)、PIG54(图58)、PIG55(图59)、GIG9(图60)、HLC-9(图61)、GIG18(图62)和MIG22(图63)原癌基因是否分别在12泳道的正常人多种组织中表达的RNA印迹结果的图；并且图43～63的下部为分别示出使与图43～63上部相同的样品和β-肌动蛋白探针杂交得到的RNA印迹结果的图。
图64～84为示出用以确定PIG12(图64)、PIG18(图65)、PIG23(图66)、PIG27(图67)、PIG28(图68)、PIG30(图69)、PIG31(图70)、PIG38(图71)、PIG40(图72)、PIG43(图73)、PIG44(图74)、PIG46(图75)、PIG47(图76)、PIG48(图77)、PIG50(图78)、PIG54(图79)、PIG55(图80)、GIG9(图81)、HLC-9(图82)、GIG18(图83)和MIG22(图84)原癌基因是否分别在人癌细胞系表达的RNA印迹结果的图；并且图64～84的下部为分别示出使与图64～84上部相同的样品和β-肌动蛋白探针杂交得到的RNA印迹结果的图。
图85～105为示出用以确定在本发明的原癌基因PIG12(图85)、PIG18(图86)、PIG23(图87)、PIG27(图88)、PIG28(图89)、PIG30(图90)、PIG31(图91)、PIG38(图92)、PIG40(图93)、PIG43(图94)、PIG44(图95)、PIG46(图96)、PIG47(图97)、PIG48(图98)、PIG50(图99)、PIG54(图100)、PIG55(图101)、GIG9(图102)、HLC-9(图103)、GIG18(图104)和MIG22(图105)分别转化到大肠杆菌后L-阿拉伯糖诱导前和诱导后表达的蛋白质大小的十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)结果的图。

具体实施例方式 下文，参照附图将详细地描述本发明的优选实施方式。
实施例1肿瘤细胞的培养和总RNA的分离 1-1.PIG12、PIG30、PIG31、PIG46、PIG47、PIG48、PIG50和PIG55 (步骤1)肿瘤细胞的培养为了进行mRNA差异显示方法，从已经进行乳房切除术的乳腺癌患者得到正常乳腺组织样品，并且从外科手术时没有进行抗癌化学治疗和/或放射治疗的乳腺癌患者在乳房切除术期间得到原发性乳腺癌组织。MCF-7(美国典型培养物保藏中心(American Type Culture Collection)；ATCC号HTB-22)用作差异显示方法中的人乳腺癌细胞系。在这个实验中使用的培养细胞处于指数生长期，且在此使用当台盼蓝染料染色(参见Freshney，″Culture of Animal CellsAManual of Basic Technique″第2版，A.R.Liss，纽约，(1987))时显示至少95％存活率的细胞。
(步骤2)RNA的分离和mRNA差异显示法使用可商购的系统RNeasy总RNA试剂盒(Qiagen公司，德国)，从步骤1得到的各正常乳腺组织、原发性乳腺癌组织和MCF-7细胞分离总RNA样品。使用message clean试剂盒(GenHunter公司，Brookline，MA，美国)从RNA样品中除去DNA污染物。
1-2.PIG18、PIG23、PIG27、PIG28和GIG9 (步骤1)肿瘤细胞的培养为了进行mRNA差异显示法，从已经进行子宫切除术的子宫肌瘤患者得到正常外宫颈组织，并且从外科手术以前未进行抗癌化学治疗和/或放射治疗的子宫癌患者得到原发性子宫颈癌组织和淋巴结转移性癌组织。CUMC-6(Kim，J.W.等人，Gynecol.Oncol.62230-240，1996)用作差异显示法中的人子宫颈癌细胞系。
将从得到的组织中获得的细胞和CUMC-6细胞系在含有2mM谷氨酰胺、100IU/ml青霉素、100μg/ml链霉素和10％胎牛血清(Gibco，美国)的Waymouth′s MB 752/1培养基(Gibco)中生长。在这个实验中使用的培养细胞处于指数生长期，并且在此使用台盼蓝染色中显示至少95％存活率的细胞(Freshney，″Culture of Animal CellsA Manual of Basic Technique″第2版，A.R.Liss，纽约，1987)。
(步骤2)RNA的分离和mRNA差异显示法使用可商购的系统RNeasy总RNA试剂盒(Qiagen公司，德国)，从步骤1得到的各正常外宫颈组织、原发性子宫颈癌组织、淋巴结转移性癌组织和CUMC-6细胞分离总RNA样品。使用message clean试剂盒(GenHunter公司，Brookline，MA，美国)从RNA样品中除去DNA污染物。
1-3.PIG38、PIG43、PIG44、PIG54和GIG18 (步骤1)肿瘤细胞的培养为了进行mRNA差异显示法，从已经进行肝组织活检的患者得到正常肝组织，并且在肝组织活检期间从以前没有进行抗癌化学治疗和/或放射治疗的肝癌患者得到原发性肝癌组织。HepG2(美国典型培养物保藏中心)用作差异显示法中的人肝癌细胞系。在这个实验中使用的培养细胞处于指数生长期，且在此使用当台盼蓝染料染色时显示至少95％存活率的细胞(参见Freshney，″Culture of Animal CellsA Manual of Basic Technique″第2版，A.R.Liss，纽约，(1987))。
(步骤2)RNA的分离和mRNA差异显示法使用可商购的系统RNeasy总RNA试剂盒(Qiagen公司，德国)，从步骤1得到的各正常肝组织、原发性肝癌组织和HepG2细胞分离总RNA样品。使用message clean试剂盒(GenHunter公司，Brookline，MA，美国)从RNA样品中除去DNA污染物。
1-4.PIG40 (步骤1)肿瘤细胞的培养为了进行mRNA差异显示法，从正常人得到外周血白细胞组织，并且在骨髓组织活检期间从以前没有进行抗癌化学治疗和/或放射治疗的白血病患者得到原发性白血病骨髓组织(primary leukemic bone marrow tissue)。K-562(美国典型培养物保藏中心；ATCC号CCL-243)用作差异显示法中的人慢性髓性白血病细胞系。
将从得到的组织中获得的细胞和K-562细胞系在含有2mM谷氨酰胺、100IU/ml青霉素、100μg/ml链霉素和10％胎牛血清(Gibco，美国)的Waymouth′s MB 752/1培养基(Gibco)中生长。在这个实验中使用的培养细胞处于指数生长期，并且在此使用台盼蓝染色中显示至少95％存活率的细胞(Freshney，″Culture of Animal CellsA Manual of Basic Technique″第2版，A.R.Liss，纽约，1987)。
(步骤2)RNA的分离和mRNA差异显示法使用可商购的系统RNeasy总RNA试剂盒(Qiagen公司，德国)，从步骤1得到的各正常人的外周血白细胞组织、原发性白血病骨髓组织和人慢性髓性白血病细胞系分离总RNA样品。使用message clean试剂盒(GenHunter公司，Brookline，MA，美国)从RNA样品中除去DNA污染物。
1-5.HLC-9和MIG22 (步骤1)肿瘤细胞的培养为了进行mRNA差异显示法，从正常人得到正常肺组织，并且在外科手术期间从以前没有进行抗癌化学治疗和/或放射治疗的肺癌患者得到原发性白血病肺癌组织和转移到右肺的癌组织。A549(美国典型培养物保藏中心；ATCC号CCL-185)用作差异显示法中的人肺癌细胞系。
将从得到的组织中获得的细胞和A549肺癌细胞系在含有2mM谷氨酰胺、100IU/ml青霉素、100μg/ml链霉素和10％胎牛血清(Gibco，美国)的Waymouth′s MB 752/1培养基(Gibco)中生长。在这个实验中使用的培养细胞处于指数生长期，并且在此使用台盼蓝染料染色时显示至少95％存活率的细胞(参见Freshney，″Culture of Animal CellsA Manual of Basic Technique″第2版，A.R.Liss，纽约，1987)。
(步骤2)RNA的分离和mRNA差异显示法使用可商购的系统RNeasy总RNA试剂盒(Qiagen公司，德国)，从步骤1得到的各正常肺组织、原发性肺癌组织、转移性肺癌组织和A549细胞分离总RNA样品。使用message clean试剂盒(GenHunter公司，Brookline，MA，美国)从RNA样品中除去DNA污染物。
实施例2差异显示反转录聚合酶链式反应(DDRT-PCR) 使用由Liang，P.和A.B.Pardee提出的稍微修改的反转录聚合酶链式反应(RT-PCR)进行差异显示反转录。
2-1.PIG12 首先，使用SEQ ID NO3的锚定引物H-T11A(5′-AAGCTTTTTTTTTTTC-3′，RNAimage试剂盒，Genhunter，Cor.，MA，美国)作为oligo-dT锚定引物将0.2μg实施例1的步骤1获得的总RNA进行反转录。
然后，使用相同的锚定引物和5′-13-mer随机引物(RNAimage引物1-5)H-AP 1～40中的引物H-AP21(SEQ ID NO4)(5′-AAGCTTTCTCTGG-3′)，在0.5mM[α-35S]dATP(1200Ci/mmole)存在下进行PCR反应。PCR反应在下述条件下进行总40个扩增循环，每个循环由95℃下40秒的变性步骤、40℃下2分钟的退火步骤和72℃下40秒的延伸步骤组成，以及接着为72℃下5分钟的最后延伸步骤。
将PCR-扩增片段在6％聚丙烯酰胺测序凝胶中分离，且然后使用放射自显影法确定差异表达条带的位置。
从干凝胶中切下FC21 cDNA的262-碱基对(bp)条带(SEQ ID NO1的913～1,174碱基位置)。将提取的凝胶加热15分钟以洗脱FC21 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增FC21 cDNA。
2-2.PIG18 除了在此使用具有SEQ ID NO7示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′，RNAimage试剂盒，Genhunter，Cor.，MA，美国)作为oligo-dT锚定引物，以及使用具有SEQ ID NO8示出的DNA序列的引物H-AP11(5′-AAGCTTCGGGTAA-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下MC113 cDNA的277-碱基对(bp)条带(SEQ ID NO5的2,023～2,299碱基位置)。将提取的凝胶加热15分钟以洗脱MC113 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增MC113cDNA。
2-3.PIG23 除了在此使用具有SEQ ID NO11示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′，RNAimage试剂盒，Genhunter，Cor.，MA，美国)作为oligo-dT锚定引物，以及使用具有SEQ ID NO12示出的DNA序列的引物H-AP33(5′-AAGCTTGCTGCTC-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下CA338d cDNA的278-碱基对(bp)条带(SEQ ID NO9的1,822～2,099碱基位置)。将提取的凝胶加热15分钟以洗脱CA338d cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增CA338dcDNA。
2-4.PIG27 除了在此使用具有SEQ ID NO15示出的DNA序列的锚定引物H-T11A(5′-AAGCTTTTTTTTTTTA-3′，RNAimage试剂盒，Genhunter，Cor.，MA，美国)作为oligo-dT锚定引物，以及使用具有SEQ ID NO16示出的DNA序列的引物H-AP12(5′-AAGCTTGAGTGCT-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下H124 cDNA的177-碱基对(bp)条带(SEQ ID NO13的243～419碱基位置)。将提取的凝胶加热15分钟以洗脱H124 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增H124 cDNA。
2-5.PIG28 除了在此使用具有SEQ ID NO19示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′，RNAimage试剂盒，Genhunter，Cor.，MA，美国)作为oligo-dT锚定引物，以及使用具有SEQ ID NO20示出的DNA序列的引物H-AP12(5′-AAGCTTGAGTGCT-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下H122 cDNA的232-碱基对(bp)条带(SEQ ID NO17的748～979碱基位置)。将提取的凝胶加热15分钟以洗脱H122 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增H122 cDNA。
2-6.PIG30 除了在此使用具有SEQ ID NO23示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′，RNAimage试剂盒，Genhunter，Cor.，MA，美国)作为oligo-dT锚定引物，以及使用具有SEQ ID NO24示出的DNA序列的引物H-AP33(5′-AAGCTTGCTGCTC-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下FC23 cDNA的271-碱基对(bp)条带(SEQ ID NO21的1,823～2,093碱基位置)。将提取的凝胶加热15分钟以洗脱FC23 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增FC23 cDNA。
2-7.PIG31 除了在此使用具有SEQ ID NO27示出的DNA序列的锚定引物H-T11G(5′-AAGCTTTTTTTTTTTG-3′)作为oligo-dT锚定引物，以及使用具有SEQ IDNO28示出的DNA序列的引物H-AP34(5′-AAGCTTCAGCAGC-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下FC34 cDNA的312-碱基对(bp)条带(SEQ ID NO25的1,884～2,195碱基位置)。将提取的凝胶加热15分钟以洗脱FC34 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增FC34 cDNA。
2-8.PIG38 除了在此使用具有SEQ ID NO31示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′)作为oligo-dT锚定引物，以及使用具有SEQ IDNO32示出的DNA序列的引物H-AP10(5′-AAGCTTCCACGTA-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下HP103 cDNA的267-碱基对(bp)条带(SEQ ID NO29的1,633～1,899碱基位置)。将提取的凝胶加热15分钟以洗脱HP103 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增HP103 cDNA。
2-9.PIG40 除了在此使用具有SEQ ID NO35示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′，RNAimage试剂盒，Genhunter，Cor.，MA，美国)作为oligo-dT锚定引物，以及使用具有SEQ ID NO36示出的DNA序列的引物H-AP11(5′-AAGCTTCGGGTAA-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下GV11 cDNA的215-碱基对(bp)条带(SEQ ID NO33的1,313～1,527碱基位置)。将提取的凝胶加热15分钟以洗脱GV11 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增GV11 cDNA。
2-10.PIG43 除了在此使用具有SEQ ID NO39示出的DNA序列的锚定引物H-T11G(5′-AAGCTTTTTTTTTTTG-3′)作为oligo-dT锚定引物，以及使用具有SEQ IDNO40示出的DNA序列的引物H-AP11(5′-AAGCTTCGGGTAA-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下HP11 cDNA的321-碱基对(bp)条带(SEQ ID NO37的879～1,199碱基位置)。将提取的凝胶加热15分钟以洗脱HP11 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增HP11 cDNA。
2-11.PIG44 除了在此使用具有SEQ ID NO43示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′)作为oligo-dT锚定引物，以及使用具有SEQ IDNO44示出的DNA序列的引物H-AP23(5′-AAGCTTGGCTATG-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下HP23 cDNA的311-碱基对(bp)条带(SEQ ID NO41的1,633～1,899碱基位置)。将提取的凝胶加热15分钟以洗脱HP23 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增HP23 cDNA。
2-12.PIG46 除了在此使用具有SEQ ID NO47示出的DNA序列的锚定引物H-T11A(5′-AAGCTTTTTTTTTTTA-3′)作为oligo-dT锚定引物，以及使用具有SEQ IDNO48示出的DNA序列的引物H-AP24(5′-AAGCTTCACTAGC-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下FC24 cDNA的256-碱基对(bp)条带(SEQ ID NO45的992～1,247碱基位置)。将提取的凝胶加热15分钟以洗脱FC24 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增FC24 cDNA。
2-13.PIG47 除了在此使用具有SEQ ID NO51示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′)作为oligo-dT锚定引物，以及使用具有SEQ IDNO52示出的DNA序列的引物H-AP5(5′-AAGCTTAGTAGGC-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下FC54 cDNA的192-碱基对(bp)条带(SEQ ID NO49的587～778碱基位置)。将提取的凝胶加热15分钟以洗脱FC54 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增FC54 cDNA。
2-14.PIG48 除了在此使用具有SEQ ID NO55示出的DNA序列的锚定引物H-T11A(5′-AAGCTTTTTTTTTTTA-3′)作为oligo-dT锚定引物，以及使用具有SEQ IDNO56示出的DNA序列的引物H-AP7(5′-AAGCTTAACGAGG-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下FC71 cDNA的272-碱基对(bp)条带(SEQ ID NO53的1,348～1,619碱基位置)。将提取的凝胶加热15分钟以洗脱FC71 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增FC71 cDNA。
2-15.PIG50 除了在此使用具有SEQ ID NO59示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′)作为oligo-dT锚定引物，以及使用具有SEQ IDNO60示出的DNA序列的引物H-AP5(5′-AAGCTTAGTAGGC-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下BBCC5-5 cDNA的182-碱基对(bp)条带(SEQ ID NO57的418～599碱基位置)。将提取的凝胶加热15分钟以洗脱BBCC5-5 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增BBCC5-5cDNA。
2-16.PIG54 除了在此使用具有SEQ ID NO63示出的DNA序列的锚定引物H-T11A(5′-AAGCTTTTTTTTTTTA-3′)作为oligo-dT锚定引物，以及使用具有SEQ IDNO64示出的DNA序列的引物H-AP15(5′-AAGCTTACGCAAC-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下HP15 cDNA的345-碱基对(bp)条带(SEQ ID NO61的1,533～1,877碱基位置)。将提取的凝胶加热15分钟以洗脱HP15 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增HP15 cDNA。
2-17.PIG55 除了在此使用具有SEQ ID NO67示出的DNA序列的锚定引物H-T11G(5′-AAGCTTTTTTTTTTTG-3′)作为oligo-dT锚定引物，以及使用具有SEQ IDNO68示出的DNA序列的引物H-AP4(5′-AAGCTTCTCAACG-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下FC4 cDNA的186-碱基对(bp)条带(SEQ ID NO65的292～477碱基位置)。将提取的凝胶加热15分钟以洗脱FC4cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增FC4 cDNA。
2-18.GIG9 除了在此使用具有SEQ ID NO71示出的DNA序列的锚定引物H-T11A(5′-AAGCTTTTTTTTTTTA-3′，RNAimage试剂盒，Genhunter，Cor.，MA，美国)作为oligo-dT锚定引物，以及使用具有SEQ ID NO72示出的DNA序列的引物H-AP14(5′-AAGCTTGGAGCTT-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下H148 cDNA的221-碱基对(bp)条带(SEQ ID NO69的769～989碱基位置)。将提取的凝胶加热15分钟以洗脱H148 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增H148 cDNA。
2-19.HLC-9 除了在此使用具有SEQ ID NO75示出的DNA序列的锚定引物H-T11G(5′-AAGCTTTTTTTTTTTG-3′)作为oligo-dT锚定引物，以及使用具有SEQ IDNO76示出的DNA序列的引物H-AP7(5′-AAGCTTAACGAGG-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下L738 cDNA的322-碱基对(bp)条带(SEQ ID NO73的1,007～1,328碱基位置)。将提取的凝胶加热15分钟以洗脱L738 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增L738 cDNA。
2-20.GIG18 除了在此使用具有SEQ ID NO79示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′)作为oligo-dT锚定引物，以及使用具有SEQ IDNO80示出的DNA序列的引物H-AP4(5′-AAGCTTCTCAACG-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下HP47 cDNA的321-碱基对(bp)条带(SEQ ID NO77的879～1,199碱基位置)。将提取的凝胶加热15分钟以洗脱HP47 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增HP47 cDNA。
2-21.MIG22 除了在此使用具有SEQ ID NO83示出的DNA序列的锚定引物H-T11A(5′-AAGCTTTTTTTTTTTA-3′，RNAimage试剂盒，Genhunter，Cor.，MA，美国)作为oligo-dT锚定引物，以及使用具有SEQ ID NO84示出的DNA序列的引物H-AP6(5′-AAGCTTGCACCAT-3′)外，以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下L690 cDNA的327-碱基对(bp)条带(SEQ ID NO81的273～599碱基位置)。将提取的凝胶加热15分钟以洗脱L690 cDNA，然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外，用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增L690 cDNA。
实施例3克隆使用TA克隆系统(Promega，美国)，根据制造商手册，将如上所述所有重新扩增的FC21产物；MC113产物；CA338d产物；H124产物；H122产物；FC23产物；FC34产物；HP103产物；GV11产物；HP11产物；HP23产物；FC24产物；FC54产物；FC71产物；BBCC5-5产物；HP15产物；FC4产物；H148产物；L738产物；HP47产物以及L690 PCR产物分别插入到pGEM-TEASY载体中。
(步骤1)连接反应将实施例2中所有重新扩增的FC21产物、MC113产物、CA338d产物、H124产物、H122产物、FC23产物、FC34产物、HP103产物、GV11产物、HP11产物、HP23产物、FC24产物、FC54产物、FC71产物、BBCC5-5产物、HP15产物、FC4产物、H148产物、L738产物、HP47产物以及L690 PCR产物各2μl；1μl pGEM-T EASY载体(50ng)；1μl T4 DNA连接酶缓冲液(10X)和1μl T4 DNA连接酶(3weiss单位/μl；Promega)置于0.5ml试管中，并向其中加入蒸馏水至终体积10μl。将该连接反应混合物在14℃下孵育过夜。
(步骤2)TA克隆的转化将大肠杆菌JM109(Promega，WI，美国)在10ml LB培养基(10g细菌用胰蛋白胨、5g细菌用酵母抽提物、5g NaCl)中培养直到在600nm的光密度达到大约0.3～0.6。将培养的混合物在冰中保持约10分钟并于4℃下4,000rpm离心10分钟，然后弃去上清液并收集细胞。将收集的细胞沉淀物暴露于10ml 0.1M冰冷却的CaCl2中大约30分钟至1小时以制备感受态细胞。将该产物再于4℃下4,000rpm离心10分钟，然后弃去上清液并收集细胞并将细胞在2ml 0.1M冰冷却的的CaCl2中悬浮。
将200μl感受态细胞悬液转移到新的微量离心管中，并向其中加入2μl步骤1中制备的各连接反应产物。将得到的混合物于42℃水浴中孵育90秒，然后0℃骤冻。向其中加入800μl SOC培养基(2.0g细菌用胰蛋白胨、0.5g细菌用酵母抽提物、1ml 1M NaCl、0.25ml 1M KCl、97ml TDW、1ml 2MMg2+、1ml 2M葡萄糖)并将得到的混合物在220rpm的旋转振荡培养箱中于37℃下孵育45分钟。
用玻璃棒将25μl X-gal(二甲基甲酰胺中40mg/ml储存)涂布到添加氨苄青霉素并预先在37℃的培养箱中保持的LB平板上，然后向其中加入25μl各转化的细胞并用玻璃板再涂布，然后于37℃下孵育过夜。孵育后，选择3～4个形成的白色菌落，然后将各选择的细胞接种在添加氨苄青霉素的LB平板上。为了构建质粒，选择在上述菌落中分别被证明为导入连接反应产物的菌落的菌株，即转化的大肠杆菌菌株JM109/FC21；JM109/MC113；JM109/CA338d；JM109/H124；JM109/H122；JM109/FC23；JM109/FC34；JM109/HP103；JM109/GV11；JM109/HP11；JM109/HP23；JM109/FC24；JM109/FC54；JM109/FC71；JM109/BBCC5-5；JM109/HP15；JM109/FC4；JM109/H148；JM109/L738；JM109/HP47以及JM109/L690，并在10ml TB培养基(terrific broth)(900ml TDW、12g细菌用胰蛋白胨、24g细菌用酵母抽提物、4ml甘油、0.17M KH2PO4、100ml 0.72N K2HPO4)中培养。
实施例4重组质粒DNA的分离使用WizardTMPlus小量制备DNA纯化试剂盒(Promega，美国)，根据制造商手册，从转化的大肠杆菌菌株中分离FC21质粒DNA。
证实少量的各分离的质粒DNA用限制性内切酶ECoRI处理，然后在2％的凝胶中电泳以证实FC21；MC113；CA338d；H124；H122；FC23；FC34；HP103；GV11；HP11；HP23；FC24；FC54；FC71；BBCC5-5；HP15；FC4；H148；L738；HP47以及L690的部分序列分别插入到质粒中。
实施例5DNA碱基序列分析根据常规方法，将所有在实施例2中获得的FC21产物；MC113产物；CA338d产物；H124产物；H122产物；FC23产物；FC34产物；HP103产物；GV11产物；HP11产物；HP23产物；FC24产物；FC54产物；FC71产物；BBCC5-5产物；HP15产物；FC4产物；H148产物；L738产物；HP47产物以及L690 PCR产物扩增、克隆并然后重新扩增。使用Sequenase version2.0DNA测序试剂盒(United States Biochemical，Cleveland，OH，美国)根据双脱氧链终止法对得到的FC21；MC113；CA338d；H124；H122；FC23；FC34；HP103；GV11；HP11；HP23；FC24；FC54；FC71；BBCC5-5；HP15；FC4；H148；L738；HP47以及L690片段进行测序。
所述基因的DNA序列对应于SEQ ID NO1的913～1,174核苷酸序列位置，其在本发明中称为“FC21”。
使用5′-随机引物H-AP21和3′-锚定引物H-T11A，将上述得到的262-bpcDNA片段，即FC21进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。如图1所示，从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图1中可见，262-bp cDNA片段FC21在乳腺癌和MCF-7癌细胞中高表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO5的2,023～2,299核苷酸序列位置，其在本发明中称为“MC113”。
使用5′-随机引物H-AP11和3′-锚定引物H-T11C，将上述得到的277-bpcDNA片段，即MC113进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。
如图2所示，从差异显示(DD)显示出基因在正常外宫颈组织、转移淋巴结组织和CUMC-6细胞中差异表达。在图2中可见，277-bp cDNA片段MC113在子宫颈癌、转移淋巴结组织和CUMC-6癌细胞中表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO9的1,822～2,099核苷酸序列位置，其在本发明中称为“CA338d”。
使用5′-随机引物H-AP33和3′-锚定引物H-T11C，将上述得到的278-bpcDNA片段，即CA338d进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。
如图3所示，从差异显示(DD)显示出基因在正常外宫颈组织、转移淋巴结组织和CUMC-6细胞中差异表达。在图3中可见，278-bp cDNA片段CA338d在子宫颈癌、转移淋巴结组织和CUMC-6癌细胞中表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO13的243～419核苷酸序列位置，其在本发明中称为“H124”。
使用5′-随机引物H-AP12和3′-锚定引物H-T11A，将上述得到的177-bpcDNA片段，即H124进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。
如图4所示，从差异显示(DD)显示出基因在正常外宫颈组织、转移淋巴结组织和CUMC-6细胞中差异表达。在图4中可见，177-bp cDNA片段H124在子宫颈癌、转移淋巴结组织和CUMC-6癌细胞中表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO17的748～979核苷酸序列位置，其在本发明中称为“H122”。
使用5′-随机引物H-AP12和3′-锚定引物H-T11C，将上述得到的232-bpcDNA片段，即H122进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。
如图5所示，从差异显示(DD)显示出基因在正常外宫颈组织、转移淋巴结组织和CUMC-6细胞中差异表达。在图5中可见，232-bp cDNA片段H122在子宫颈癌、转移淋巴结组织和CUMC-6癌细胞中表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO21的1,823～2,093核苷酸序列位置，其在本发明中称为“FC23”。
使用5′-随机引物H-AP23和3′-锚定引物H-T11C，将上述得到的271-bpcDNA片段，即FC23进行差异显示反转录聚合酶链反应(DDRT-PCR)，且然后使用电泳确认。如图6所示，从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图6中可见，271-bp cDNA片段FC23在乳腺癌和MCF-7癌细胞中高表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO25的1,884～2,195核苷酸序列位置，其在本发明中称为“FC34”。
使用5′-随机引物H-AP34和3′-锚定引物H-T11G，将上述得到的312-bpcDNA片段，即FC34进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。如图7所示，从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图7中可见，312-bp cDNA片段FC34在乳腺癌和MCF-7癌细胞中高表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO29的1,633～1,899核苷酸序列位置，其在本发明中称为“HP103”。
使用5′-随机引物H-AP10和3′-锚定引物H-T11C，将上述得到的267-bpcDNA片段，即HP103进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。如图8所示，从差异显示(DD)显示出基因在正常肝组织、肝癌组织和HepG2细胞中差异表达。在图8中可见，267-bp cDNA片段HP103在肝癌和HepG2癌细胞中表达，而在正常组织中不表达或检测不到。
所述基因的DNA序列对应于SEQ ID NO33的1,313～1,527核苷酸序列位置，其在本发明中称为“GV1”。
使用5′-随机引物H-AP11和3′-锚定引物H-T11C，将上述得到的215-bpcDNA片段，即GV11进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。
如图9所示，从差异显示(DD)显示出基因在正常外周血组织、白血病组织和K-562细胞中差异表达。在图9中可见，215-bp cDNA片段GV11在白血病组织和K-562癌细胞中表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO37的879～1,199核苷酸序列位置，其在本发明中称为“HP11”。
使用5′-随机引物H-AP11和3′-锚定引物H-T11G，将上述得到的321-bpcDNA片段，即HP11进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。如图10所示，从差异显示(DD)显示出基因在正常肝组织、肝癌组织和HepG2细胞中差异表达。在图10中可见，321-bp cDNA片段HP11在肝癌组织和HepG2癌细胞中表达，而在正常组织中不表达或检测不到。
所述基因的DNA序列对应于SEQ ID NO41的1,369～1,679核苷酸序列位置，其在本发明中称为“HP23”。
使用5′-随机引物H-AP23和3′-锚定引物H-T11C，将上述得到的311-bpcDNA片段，即HP23进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。如图11所示，从差异显示(DD)显示出基因在正常肝组织、肝癌组织和HepG2细胞中差异表达。在图11中可见，311-bp cDNA片段HP23在肝癌和HepG2癌细胞中表达，而在正常组织中不表达或很少表达。
所述基因的DNA序列对应于SEQ ID NO45的992～1,247核苷酸序列位置，其在本发明中称为“FC24”。
使用5′-随机引物H-AP24和3′-锚定引物H-T11A，将上述得到的256-bpcDNA片段，即FC24进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。如图12所示，从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图12中可见，256-bp cDNA片段FC24在乳腺癌组织和MCF-7癌细胞中高表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO49的587～778核苷酸序列位置，其在本发明中称为“FC54”。
使用5′-随机引物H-AP5和3′-锚定引物H-T11C，将上述得到的192-bpcDNA片段，即FC54进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。如图13所示，从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图13中可见，192-bp cDNA片段FC54在乳腺癌组织和MCF-7癌细胞中高表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO53的1,348～1,619核苷酸序列位置，其在本发明中称为“FC71”。
使用5′-随机引物H-AP7和3′-锚定引物H-T11A，将上述得到的272-bpcDNA片段，即FC71进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。如图14所示，从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图14中可见，272-bp cDNA片段FC71在乳腺癌组织和MCF-7癌细胞中高表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO57的418～599核苷酸序列位置，其在本发明中称为“BBCC5-5”。
使用5′-随机引物H-AP5和3′-锚定引物H-T11C，将上述得到的182-bpcDNA片段，即BBCC5-5进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。如图15所示，从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图15中可见，182-bp cDNA片段BBCC5-5在乳腺癌组织和MCF-7癌细胞中高表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO61的1,533～1,877核苷酸序列位置，其在本发明中称为“HP15”。
使用5′-随机引物H-AP15和3′-锚定引物H-T11A，将上述得到的345-bpcDNA片段，即HP15进行差异显示反转录聚合酶链反应(DDRT-PCR)，且然后使用电泳确认。如图16所示，从差异显示(DD)显示出基因在正常肝组织、肝癌组织和HepG2细胞中差异表达。在图16中可见，345-bp cDNA片段HP15在肝癌组织和HepG2癌细胞中表达，而在正常组织中不表达或很少表达。
所述基因的DNA序列对应于SEQ ID NO65的292～477核苷酸序列位置，其在本发明中称为“FC4”。
使用5′-随机引物H-AP4和3′-锚定引物H-T11G，将上述得到的186-bpcDNA片段，即FC4进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。如图17所示，从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图17中可见，186-bp cDNA片段FC4在乳腺癌组织和MCF-7癌细胞中高表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO69的769～989核苷酸序列位置，其在本发明中称为“H148”。
使用5′-随机引物H-AP14和3′-锚定引物H-T11A，将上述得到的221-bpcDNA片段，即H148进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。
如图18所示，从差异显示(DD)显示出基因在正常外宫颈组织、转移淋巴结组织和CUMC-6细胞中差异表达。在图18中可见，221-bp cDNA片段H148在子宫颈癌组织、转移淋巴结组织和CUMC-6癌细胞中表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO73的1,007～1,328核苷酸序列位置，其在本发明中称为“L738”。
使用5′-随机引物H-AP7和3′-锚定引物H-T11G，将上述得到的322-bpcDNA片段，即L738进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。如图19所示，从差异显示(DD)显示出基因在正常肺组织、左肺癌组织、从左肺转移到右肺的转移性肺癌组织和A549肺癌细胞中差异表达。在图19中可见，322-bp cDNA片段L738在肺癌组织、转移性肺癌组织和A549肺癌细胞中表达，而在正常肺组织中不表达或很少表达。
所述基因的DNA序列对应于SEQ ID NO77的879～1,199核苷酸序列位置，其在本发明中称为“HP47”。
使用5′-随机引物H-AP4和3′-锚定引物H-T11C，将上述得到的321-bpcDNA片段，即HP47进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。如图20所示，从差异显示(DD)显示出基因在正常肝组织、肝癌组织和HepG2细胞中差异表达。在图20中可见，321-bp cDNA片段HP47在肝癌组织和HepG2癌细胞中表达，而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO81的273～599核苷酸序列位置，其在本发明中称为“L690”。
使用5′-随机引物H-AP6和3′-锚定引物H-T11A，将上述得到的327-bpcDNA片段，即L690进行差异显示反转录聚合酶链式反应(DDRT-PCR)，且然后使用电泳确认。
如图21所示，从差异显示(DD)显示出基因在正常肺组织、左肺癌组织、从左肺转移到右肺的转移性肺癌组织和A549肺癌细胞中差异表达。在图21中可见，327-bp cDNA片段L690在肺癌组织、转移性肺癌组织和A549肺癌细胞中表达，而在正常肺组织中很少表达或不表达。尤其是，327-bp cDNA片段L690在癌组织，例如转移性癌组织中表达最高。
实施例6全长原癌基因的cDNA序列分析 6-1.PIG12 使用32P-标记的FC21作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA库(bacteriophageλgt11 human lung embryonic fibroblast cDNAlibrary)(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,258-bp片段插入到pCEV-LAC载体的全长PIG12 cDNA克隆，然后于2004年2月16日以收录号AY550973保存在美国GenBank数据库(预定发布日期2005年12月31日)。
AY550973基因的DNA序列与以收录号NM_006299保存在数据库中的人类基因锌指蛋白193(ZNF193)基因的相似。与以前报道的其功能相反，然而从本研究结果发现AY550973基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果，发现PIG12原癌基因在包括乳腺组织的多种正常人组织中很少表达，而在包括乳腺癌的多种癌组织中其表达明显升高。
由1,258bp组成的PIG12的全长DNA序列在SEQ ID NO1中示出。
在SEQ ID NO1的DNA序列中，估计本发明的原癌基因的全长可读框对应于68～1,252的核苷酸序列位置，并且编码SEQ ID NO2的由394个氨基酸组成的蛋白质。
6-2.PIG18 使用32P-标记的MC113作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将2,403-bp片段插入到pCEV-LAC载体的全长PIG18 cDNA克隆，然后于2004年10月5日以收录号AY771596保存在美国GenBank数据库(预定发布日期2005年12月31日)。
将插入到λpCEV载体的PIG18克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(Miki，T.等人，Gene 83137-146，1989)。
通过T4 DNA连接酶连接含有PIG18基因的pCEV-LAC载体以制备PIG18质粒DNA，且然后用连接的克隆转化大肠杆菌DH5α。
由2,403bp组成的PIG18的全长DNA序列在SEQ ID NO5中示出。
在SEQ ID NO5的DNA序列中，估计本发明的原癌基因的全长可读框对应于875～1,063的核苷酸序列位置，并且编码SEQ ID NO6的由62个氨基酸组成的蛋白质。
6-3.PIG23 使用32P-标记的CA338d作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA库获得其中将2,150-bp片段插入到pCEV-LAC载体的全长PIG23 cDNA克隆，然后于2004年10月23日以收录号AY826819保存在美国GenBank数据库(预定发布日期2005年12月31日)。
将插入到λpCEV载体的PIG23克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(Miki，T.等人，Gene 83137-146，1989)。
通过T4DNA连接酶连接含有PIG23基因的pCEV-LAC载体以制备PIG23质粒DNA，且然后用连接的克隆转化大肠杆菌DH5α。
由2,150bp组成的PIG23的全长DNA序列在SEQ ID NO9中示出。
在SEQ ID NO9的DNA序列中，估计本发明的原癌基因的全长可读框对应于25～1,953的核苷酸序列位置，并且编码SEQ ID NO10的由642个氨基酸组成的蛋白质。
6-4.PIG27 使用32P-标记的H124作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将446-bp片段插入到pCEV-LAC载体的全长PIG27 cDNA克隆，然后于2003年10月30日以收录号AY453399保存在美国GenBank数据库(预定发布日期2005年3月31日)。
将插入到λpCEV载体的PIG27克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(Miki，T.等人，Gene 83137-146，1989)。
通过T4 DNA连接酶连接含有PIG27基因的pCEV-LAC载体以制备PIG27质粒DNA，且然后用连接的克隆转化大肠杆菌DH5α。
由446bp组成的PIG27的全长DNA序列在SEQ ID NO13中示出。
在SEQ ID NO13的DNA序列中，估计本发明的原癌基因的全长可读框对应于20～337的核苷酸序列位置，并且编码SEQ ID NO14的由105个氨基酸组成的蛋白质。
6-5.PIG28 使用32P-标记的H122作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,024-bp片段插入到pCEV-LAC载体的全长PIG28 cDNA克隆，然后于2003年10月30日以收录号AY453398保存在美国GenBank数据库(预定发布日期2005年3月31日)。
将插入到λpCEV载体的PIG28克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(Miki，T.等人，Gene 83137-146，1989)。
通过T4 DNA连接酶连接含有PIG28基因的pCEV-LAC载体以制备PIG28质粒DNA，且然后用连接的克隆转化大肠杆菌DH5α。
由1,024bp组成的PIG28的全长DNA序列在SEQ ID NO17中示出。
在SEQ ID NO17的DNA序列中，估计本发明的原癌基因的全长可读框对应于33～998的核苷酸序列位置，并且编码SEQ ID NO18的由321个氨基酸组成的蛋白质。
6-6.PIG30 使用32P-标记的FC23作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将2,152-bp片段插入到pCEV-LAC载体的全长PIG30 cDNA克隆，然后于2004年2月16日以收录号AY550975保存在美国GenBank数据库(预定发布日期2005年12月31日)。
AY550975基因的DNA序列与以收录号NM_005186保存在数据库中的人类钙蛋白酶1，(mu/I)大亚基(CAPN1)基因的相似。与以前报道的其功能相反，然而从本研究结果发现AY550975基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果，发现PIG30原癌基因在包括乳腺组织的多种正常人组织中很少表达，而在包括乳腺癌的多种癌组织中其表达明显升高。
由2,152bp组成的PIG30的全长DNA序列在SEQ ID NO21中示出。
在SEQ ID NO21的DNA序列中，估计本发明的原癌基因的全长可读框对应于6～2,150的核苷酸序列位置，并且编码SEQ ID NO22的由714个氨基酸组成的蛋白质。
6-7.PIG31 使用32P-标记的FC34作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将2,246-bp片段插入到pCEV-LAC载体的全长PIG31 cDNA克隆，然后于2004年6月3日以收录号AY644768保存在美国GenBank数据库(预定发布日期2005年12月31日)。AY644768基因的DNA序列与以收录号AF085199保存在数据库中的人类golgin-84mRNA基因的相似。与以前报道的其功能相反，然而从本研究结果发现AY644768基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果，发现PIG31原癌基因在包括乳腺组织的多种正常人组织中很少表达，而在包括乳腺癌的多种癌组织中其表达明显升高。
由2,246bp组成的PIG31的全长DNA序列在SEQ ID NO25中示出。
在SEQ ID NO25的DNA序列中，估计本发明的原癌基因的全长可读框对应于37～2,232的核苷酸序列位置，并且编码SEQ ID NO26的由731个氨基酸组成的蛋白质。
6-8.PIG38 使用32P-标记的HP103作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA库获得其中将1,973-bp片段插入到pCEV-LAC载体的全长PIG38 cDNA克隆，然后于2003年12月24日以收录号AY513282保存在美国GenBank数据库(预定发布日期2005年12月31日)。AY513282基因的DNA序列与以收录号BC024178保存在数据库中的人类假定蛋白FLJ10094基因的相似。然而，该基因的功能是未知的。与以前报道的其功能相反，然而从本研究结果发现AY513282基因与尤其包括肝癌的多种肿瘤发生密切相关。作为研究结果，发现PIG38原癌基因在包括肝组织的多种正常人组织中很少表达，而在包括肝癌的多种癌组织中其表达明显升高。
由1,973bp组成的PIG38的全长DNA序列在SEQ ID NO29中示出。
在SEQ ID NO29的DNA序列中，估计本发明的原癌基因的全长可读框对应于25～1,956的核苷酸序列位置，并且编码SEQ ID NO30的由643个氨基酸组成的蛋白质。
6-9.PIG40 使用32P-标记的GV11作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,586-bp片段插入到pCEV-LAC载体的全长PIG40 cDNA克隆，然后于2004年9月23日以收录号AY762100保存在美国GenBank数据库(预定发布日期2005年3月31日)。
将插入到λpCEV载体的PIG40克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(Miki，T.等人，Gene 83137-146，1989)。
通过T4 DNA连接酶连接含有PIG40基因的pCEV-LAC载体以制备PIG40质粒DNA，且然后用连接的克隆转化大肠杆菌DH5α。
由1,586bp组成的PIG40的全长DNA序列在SEQ ID NO33中示出。
在SEQ ID NO33的DNA序列中，估计本发明的原癌基因的全长可读框对应于36～1,541的核苷酸序列位置，并且编码SEQ ID NO34的由501个氨基酸组成的蛋白质。
6-10.PIG43 使用32P-标记的HP11作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,245-bp片段插入到pCEV-LAC载体的全长PIG43 cDNA克隆，然后于2003年12月25日以收录号AY513283保存在美国GenBank数据库(预定发布日期2005年12月31日)。AY513283基因的DNA序列与以收录号NM_002065保存在数据库中的人类谷氨酸-氨连接酶(谷氨酰胺合成酶)(GLUL)基因的相似，但它们表达的蛋白质彼此不同。与以前报道的其功能相反，然而从本研究结果发现AY513283基因与尤其包括肝癌的多种肿瘤发生密切相关。作为研究结果，发现PIG43原癌基因在包括肝组织的多种正常人组织中很少表达，而在包括肝癌的多种癌组织中其表达明显升高。
由1,245bp组成的PIG43的全长DNA序列在SEQ ID NO37中示出。
在SEQ ID NO37的DNA序列中，估计本发明的原癌基因的全长可读框对应于57～758的核苷酸序列位置，并且编码SEQ ID NO38的由233个氨基酸组成的蛋白质。
6-11.PIG44 使用32P-标记的HP23作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,721-bp片段插入到pCEV-LAC载体的全长PIG44 cDNA克隆，然后于2003年12月25日以收录号AY513284保存在美国GenBank数据库(预定发布日期2005年12月31日)。AY513282基因的DNA序列与以收录号AB037773保存在数据库中的人类假定蛋白FLJ10094基因的相似，但它们表达的蛋白质彼此不同。与以前报道的其功能相反，然而从本研究结果发现AY513284基因与尤其包括肝癌的多种肿瘤发生密切相关。作为研究结果，发现PIG44原癌基因在包括肝组织的多种正常人组织中很少表达，而在包括肝癌的多种癌组织中其表达明显升高。
由1,721bp组成的PIG44的全长DNA序列在SEQ ID NO41中示出。
在SEQ ID NO41的DNA序列中，估计本发明的原癌基因的全长可读框对应于55～1,512的核苷酸序列位置，并且编码SEQ ID NO42的由485个氨基酸组成的蛋白质。
6-12.PIG46 使用32P-标记的FC24作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,312-bp片段插入到pCEV-LAC载体的全长PIG46 cDNA克隆，然后于2004年9月23日以收录号AY762101保存在美国GenBank数据库(预定发布日期2005年12月31日)。AY762101基因的DNA序列与以收录号NM_000224保存在数据库中的人类角蛋白18(KRT18)，转录变体1(keratin 18(KRT18)，transcriptional variant 1)基因的相似。与以前报道的其功能相反，然而从本研究结果发现AY762101基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果，发现PIG46原癌基因在包括乳腺组织的多种正常人组织中很少表达，而在包括乳腺癌的多种癌组织中其表达明显升高。
由1,312bp组成的PIG46的全长DNA序列在SEQ ID NO45中示出。
在SEQ ID NO45的DNA序列中，估计本发明的原癌基因的全长可读框对应于5～1,297的核苷酸序列位置，并且编码SEQ ID NO46的由430个氨基酸组成的蛋白质。
6-13.PIG47 使用32P-标记的FC54作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将827-bp片段插入到pCEV-LAC载体的全长PIG47 cDNA克隆，然后于2005年1月1日以收录号AY871272保存在美国GenBank数据库(预定发布日期2006年10月1日)。AY871272基因的DNA序列与以收录号NM_001688保存在数据库中的ATP合酶，H+转运，线粒体F0复合物，亚基b，亚型1(ATP5F1)(ATP sythetase，H+transporting，mitochondria F0 complex，subunit b，isoform 1(ATP5F1))基因的相似。与以前报道的其功能相反，然而从本研究结果发现AY871272基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果，发现PIG47原癌基因在包括乳腺组织的多种正常人组织中很少表达，而在包括乳腺癌的多种癌组织中其表达明显升高。由827bp组成的PIG47的全长DNA序列在SEQ ID NO49中示出。
在SEQ ID NO49的DNA序列中，估计本发明的原癌基因的全长可读框对应于56～826的核苷酸序列位置，并且编码SEQ ID NO50的由256个氨基酸组成的蛋白质。
6-14.PIG48 使用32P-标记的FC71作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,707-bp片段插入到pCEV-LAC载体的全长PIG48 cDNA克隆，然后于2004年1月12日以收录号AY524046保存在美国GenBank数据库(预定发布日期2005年12月31日)。AY524046基因的DNA序列与以收录号NM_005998保存在数据库中的人类包含TCP1的陪伴蛋白，亚基3(γ)(CCT3)基因的相似。与以前报道的其功能相反，然而从本研究结果发现AY524046基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果，发现PIG48原癌基因在包括乳腺组织的多种正常人组织中很少表达，而在包括乳腺癌的多种癌组织中其表达明显升高。
由1,707bp组成的PIG48的全长DNA序列在SEQ ID NO53中示出。
在SEQ ID NO53的DNA序列中，估计本发明的原癌基因的全长可读框对应于57～1,694的核苷酸序列位置，并且编码SEQ ID NO54的由545个氨基酸组成的蛋白质。
6-15.PIG50 使用32P-标记的BBCC5-5作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将643-bp片段插入到pCEV-LAC载体的全长PIG50cDNA克隆，然后于2004年2月5日以收录号AY542309保存在美国GenBank数据库(预定发布日期2005年12月31日)。AY542309基因的DNA序列与以收录号AK000504保存在数据库中的人类cDNA FLJ20497 fis基因的相似。与以前报道的其功能相反，然而从本研究结果发现AY542309基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果，发现PIG50原癌基因在包括乳腺组织的多种正常人组织中很少表达，而在包括乳腺癌的多种癌组织中其表达明显升高。
由643bp组成的PIG50的全长DNA序列在SEQ ID NO57中示出。
在SEQ ID NO57的DNA序列中，估计本发明的原癌基因的全长可读框对应于2～595的核苷酸序列位置，并且编码SEQ ID NO58的由197个氨基酸组成的蛋白质。
6-16.PIG54 使用32P-标记的HP15作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,936-bp片段插入到pCEV-LAC载体的全长PIG44 cDNA克隆，然后于2004年2月16日以收录号AY550968保存在美国GenBank数据库(预定发布日期2005年12月31日)。AY550968基因的DNA序列与以收录号BC041361保存在数据库中的人类SCC-112蛋白质基因的相似。与以前报道的其功能相反，然而从本研究结果发现AY550968基因与尤其包括肝癌的多种肿瘤发生密切相关。作为研究结果，发现PIG54原癌基因在包括肝组织的多种正常人组织中很少表达，而在包括肝癌的多种癌组织中其表达明显升高。
由1,936bp组成的PIG54的全长DNA序列在SEQ ID NO61中示出。
在SEQ ID NO61的DNA序列中，估计本发明的原癌基因的全长可读框对应于38～1,840的核苷酸序列位置，并且编码SEQ ID NO62的由600个氨基酸组成的蛋白质。
6-17.PIG55 使用32P-标记的FC4作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将526-bp片段插入到pCEV-LAC载体的全长PIG55 cDNA克隆，然后于2004年6月2日以收录号AY644767保存在美国GenBank数据库(预定发布日期2005年12月31日)。AY644767基因的DNA序列与以收录号NM_007362保存在数据库中的20kDa人类核帽结合蛋白亚基2(NCBP2)基因的相似。与以前报道的其功能相反，然而从本研究结果发现AY644767基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果，发现PIG55原癌基因在包括乳腺组织的多种正常人组织中很少表达，而在包括乳腺癌的多种癌组织中其表达明显升高。
由526bp组成的PIG55的全长DNA序列在SEQ ID NO65中示出。
在SEQ ID NO65的DNA序列中，估计本发明的原癌基因的全长可读框对应于15～485的核苷酸序列位置，并且编码SEQ ID NO66的由156个氨基酸组成的蛋白质。
6-18.GIG9 使用32P-标记的H148作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA库获得其中将1,008-bp片段插入到pCEV-LAC载体的全长GIG9 cDNA克隆，然后于2003年10月29日以收录号AY453396保存在美国GenBank数据库(预定发布日期2005年12月31日)。
将插入到λpCEV载体的GIG9克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(Miki，T.等人，Gene 83137-146，1989)。
通过T4 DNA连接酶连接含有GIG9基因的pCEV-LAC载体以制备GIG9质粒DNA，且然后用连接的克隆转化大肠杆菌DH5α。
由1,008bp组成的GIG9的全长DNA序列在SEQ ID NO69中示出。
在SEQ ID NO69的DNA序列中，估计本发明的原癌基因的全长可读框对应于1～1,008的核苷酸序列位置，并且编码SEQ ID NO70的由335个氨基酸组成的蛋白质。
6-19.HLC-9 使用32P-标记的L738作为探针筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)，从而得到含有L738 cDNA序列的全长基因。从人胚肺成纤维细胞cDNA文库获得两个全长基因；一个得到的基因为其中将1,382-bp片段插入到pCEV-LAC载体的全长HLC9 cDNA克隆，然后于2002年11月30日以收录号AY189686保存在美国GenBank数据库(预定发布日期2004年5月1日)。
将插入到λpCEV载体的HLC9克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(参加上述参考文献)。
通过T4 DNA连接酶连接含有HLC9基因的pCEV-LAC载体以制备HLC9质粒DNA，且然后用连接的克隆转化大肠杆菌DH5α。
由1,382bp组成的HLC9的全长DNA序列在SEQ ID NO73中示出。
在SEQ ID NO73的DNA序列中，估计本发明的原癌基因的全长可读框对应于27～1,370的核苷酸序列位置，并且编码SEQ ID NO74的由447个氨基酸组成的蛋白质。
6-20.GIG18 使用32P-标记的HP47作为探针筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,301-bp片段插入到pCEV-LAC载体的全长GIG18 cDNA克隆，然后于2003年12月24日以收录号AY513279保存在美国GenBank数据库(预定发布日期2005年12月31日)。证实AY513279基因的DNA序列与以收录号NM_002079保存在数据库中的人类谷草转氨酶1，可溶(天冬氨酸转氨酶1)(GOT1)mRNA基因的相似。与以前报道的其功能相反，然而从本研究结果发现AY513279基因与尤其包括肝癌的多种肿瘤发生密切相关。作为研究结果，发现GIG18原癌基因在包括肝组织的多种正常人组织中很少表达，而在包括肝癌的多种癌组织中其表达明显升高。由1,301bp组成的GIG18的全长DNA序列在SEQ ID NO77中示出。
在SEQ ID NO77的DNA序列中，估计本发明的原癌基因的全长可读框对应于3～1,244的核苷酸序列位置，并且编码SEQ ID NO78的由413个氨基酸组成的蛋白质。
6-21.MIG22 使用32P-标记的L690作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.等人，Gene 83137-146，1989)。从人胚肺成纤维细胞cDNA库获得其中将749-bp片段插入到pCEV-LAC载体的全长MIG22 cDNA克隆，然后于2004年10月5日以收录号AY771595保存在美国GenBank数据库(预定发布日期2005年12月31日)。
将插入到λpCEV载体的MIG22克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(Miki，T.等人，Gene83137-146，1989)。
通过T4 DNA连接酶连接含有MIG22基因的pCEV-LAC载体以制备MIG22质粒DNA，且然后用连接的克隆转化大肠杆菌DH5α。
在SEQ ID NO81的DNA序列中，估计本发明的原癌基因的全长可读框对应于15～734的核苷酸序列位置，并且编码SEQ ID NO82的由239个氨基酸组成的蛋白质。
实施例7多种细胞中原癌基因的RNA印迹分析 7-1.PIG12、PIG30、PIG31、PIG46、PIG47、PIG48、PIG50和PIG55 以与实施例1-1相同的方式从正常乳腺组织、乳腺癌组织和乳腺细胞系MCF-7中提取总RNA样品。
为了确定各PIG基因的表达水平，将20μg从各组织和细胞系中提取的变性的各总RNA样品在1％甲醛琼脂糖凝胶中电泳，且然后将得到的琼脂糖凝胶转移到尼龙膜(Boehringer-Mannheim，德国)上。然后将印迹与使用Rediprime II随机引物标记系统(Amersham，英国)制备的32P-标记的随机引物FC21 cDNA探针杂交。将RNA印迹分析重复两次，并因此将得到的印迹用光密度计定量并用β-肌动蛋白标准化。
图22显示确定PIG12原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)是否表达的RNA印迹结果。如图22所示，显示出在乳腺癌组织和乳腺癌细胞系MCF-7中MIG3原癌基因的表达水平明显升高，而在正常组织中表达水平非常低或检测不到。在图22中，“正常”泳道表示正常乳腺组织，“癌”泳道表示乳腺癌组织，以及“MCF-7”泳道表示乳腺癌细胞系。图22的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图43示出确定PIG12原癌基因在12-泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图43的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图43所示，显示PIG12 mRNA转录物(大约2.0kb)在多种正常组织中不表达。
图64示出确定PIG12原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图64的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图64所示，显示PIG12 mRNA转录物在HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4和伯基特淋巴瘤细胞系Raji中有非常高的表达，而在早幼粒细胞白血病细胞系HL-60、结肠癌细胞系SW480、皮肤癌细胞系G361和肺癌细胞系A549中不表达。
图27示出确定PIG30原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)中是否表达的RNA印迹结果。如图27所示，显示PIG30原癌基因在乳腺癌组织和乳腺癌细胞系MCF-7中的表达水平明显升高，而在正常组织中表达水平非常低或未检测到。在图27中，“正常”泳道表示正常乳腺组织，“癌”泳道表示乳腺癌组织，以及“MCF-7”泳道表示乳腺癌细胞系。图27的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图48示出确定PIG30原癌基因在12泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图48的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图48所示，显示PIG30 mRNA转录物(大约3.5kb)在多种正常组织中很少表达。
图69示出确定PIG30原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图69的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图69所示，显示PIG30 mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。
图28示出确定PIG31原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)中是否表达的RNA印迹结果。如图28所示，显示PIG31原癌基因在乳腺癌组织和乳腺癌细胞系MCF-7中的表达水平明显升高，而在正常组织中表达水平非常低或未检测到。在图28中，“正常”泳道表示正常乳腺组织，“癌”泳道表示乳腺癌组织，以及“MCF-7”泳道表示乳腺癌细胞系。图28的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图49示出确定PIG31原癌基因在12泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图49的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图49所示，显示PIG31 mRNA转录物(大约2.5kb)在多种正常组织中很少表达。
图70示出确定PIG31原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图70的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图70所示，显示PIG31mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。
图33示出确定PIG46原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)中是否表达的RNA印迹结果。如图33所示，显示PIG46原癌基因在乳腺癌组织和乳腺癌细胞系MCF-7中的表达水平明显升高，而在正常组织中表达水平非常低或未检测到。在图33中，“正常”泳道表示正常乳腺组织，“癌”泳道表示乳腺癌组织，以及“MCF-7”泳道表示乳腺癌细胞系。图33的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图54示出确定PIG46原癌基因在12泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图54的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图54所示，显示PIG46 mRNA转录物(大约1.4kb)在多种正常组织中很少表达或不表达。
图75示出确定PIG46原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图75的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图75所示，显示PIG46 mRNA转录物(大约1.4kb)在HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、结肠癌细胞系SW480和肺癌细胞系A549高表达，而在早幼粒细胞白血病细胞系HL-60、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji和皮肤癌细胞系G361中不表达。
图34示出确定PIG47原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)中是否表达的RNA印迹结果。如图34所示，显示PIG47原癌基因在乳腺癌组织和乳腺癌细胞系MCF-7中的表达水平明显升高，而在正常组织中表达水平非常低或未检测到。在图34中，“正常”泳道表示正常乳腺组织，“癌”泳道表示乳腺癌组织，以及“MCF-7”泳道表示乳腺癌细胞系。图34的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图55示出确定PIG47原癌基因在12泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图55的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图55所示，显示PIG47 mRNA转录物(大约1.3kb)在正常心脏和肌肉组织中表达，而在多种正常组织中很少表达。
图76示出确定PIG47原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图76的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图76所示，显示PIG47 mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4和伯基特淋巴瘤细胞系Raji高表达，而在结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中不表达。
图35示出确定PIG48原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)中是否表达的RNA印迹结果。如图35所示，显示PIG48原癌基因在乳腺癌组织和乳腺癌细胞系MCF-7中的表达水平明显升高，而在正常组织中表达水平非常低或未检测到。在图35中，“正常”泳道表示正常乳腺组织，“癌”泳道表示乳腺癌组织，以及“MCF-7”泳道表示乳腺癌细胞系。图35的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图56示出确定PIG48原癌基因在12泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图56的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图56所示，显示PIG48 mRNA转录物(大约2.0kb)在多种正常组织中很少表达或不表达。
图77示出确定PIG48原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图77的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图77所示，显示PIG48 mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中表达非常高。
图36示出确定PIG50原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)中是否表达的RNA印迹结果。如图36所示，显示PIG50原癌基因在乳腺癌组织和乳腺癌细胞系MCF-7中的表达水平明显升高，而在正常组织中表达水平未检测到。在图36中，“正常”泳道表示正常乳腺组织，“癌”泳道表示乳腺癌组织，以及“MCF-7”泳道表示乳腺癌细胞系。图36的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图57示出确定PIG50原癌基因在12泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图57的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图57所示，显示PIG50 mRNA转录物(大约1.0kb)在多种正常组织中很少表达或不表达。而且，同时也显示具有大约5.0kb大小的PIG50 mRNA转录物很少表达。
图78示出确定PIG50原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图78的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图78所示，显示PIG50mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361高表达。而且，同时也显示具有大约5.0kb大小的PIG50 mRNA转录物高表达。
图38示出确定PIG55原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)中是否表达的RNA印迹结果。如图38所示，显示PIG55原癌基因在乳腺癌组织和乳腺癌细胞系MCF-7中的表达水平明显升高，而在正常组织中表达水平非常低或未检测到。在图38中，“正常”泳道表示正常乳腺组织，“癌”泳道表示乳腺癌组织，以及“MCF-7”泳道表示乳腺癌细胞系。图38的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图59示出确定PIG55原癌基因在12泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图59的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图59所示，显示PIG55 mRNA转录物(大约3.0kb)在多种正常组织中很少表达或不表达。
图80示出确定PIG55原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图80的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图80所示，显示PIG55mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361高表达。
7-2.PIG18、PIG23、PIG27、PIG28和GIG9 以与实施例1-2相同的方式从正常外宫颈组织、子宫颈癌组织、宫颈部淋巴结转移性组织和子宫颈癌细胞系CaSki(ATCC CRL 1550)和CUMC-6中提取总RNA样品。
为了确定各PIG或GIG基因的表达水平，将20μg从组织和细胞系中提取的变性的各总RNA样品在1％甲醛琼脂糖凝胶中电泳，且然后将得到的琼脂糖凝胶转移到尼龙膜(Boehringer-Mannheim，德国)。然后将印迹与使用Rediprime II随机引物标记系统(Amersham，英国)制备的32P-标记的随机引物全长PIG23 cDNA探针杂交。将RNA印迹分析重复两次，且然后将得到的印迹用光密度计定量并用β-肌动蛋白标准化。
图23显示确定PIG18原癌基因在正常外宫颈组织、子宫颈癌组织、宫颈部淋巴结转移性组织和子宫颈癌细胞系(CaSki和CUMC-6)是否表达的RNA印迹结果。如图23所示，显示PIG18原癌基因的表达水平升高，即，具有大约5.0kb大小的优势PIG18 mRNA转录物在子宫颈癌组织和子宫颈癌细胞系CaSki和CUMC-6中过表达。在图23中，“正常”泳道表示正常外宫颈组织，“癌”泳道表示子宫颈癌组织，“转移”泳道表示宫颈部淋巴结转移性组织，以及“CaSki”和“CUMC-6”泳道各表示子宫癌细胞系。图23的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图44示出确定PIG18原癌基因在12-泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图44的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图44所示，显示PIG18 mRNA转录物(具有大约5.0kb大小的优势PIG18mRNA转录物)在正常组织，如脑、心脏、肌肉、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞中很少表达或不表达。而且，同时显示具有大约3.0kb大小的PIG18 mRNA转录物在正常心脏中很少表达。
图65示出确定PIG18原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图65的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图65所示，显示PIG18 mRNA转录物(具有大约5.0kb大小的优势PIG18 mRNA转录物)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中有非常高的表达。而且，显示具有3.0kb大小的PIG18 mRNA转录物同时在HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4中以升高的水平表达。
图24显示确定PIG23原癌基因在正常外宫颈组织、子宫颈癌组织、宫颈部淋巴结转移性组织和子宫颈癌细胞系(CaSki和CUMC-6)是否表达的RNA印迹结果。如图24所示，显示PIG23原癌基因的表达水平升高，即，具有大约4.5kb大小的优势PIG23 mRNA转录物在子宫颈癌组织、宫颈部淋巴结转移性组织和子宫颈癌细胞系CaSki和CUMC-6中过表达。在图24中，“正常”泳道表示正常外宫颈组织，“癌”泳道表示子宫颈癌组织，“转移”泳道表示宫颈部淋巴结转移性组织，以及“CaSki”和“CUMC-6”泳道各表示子宫癌细胞系。图24的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图45示出确定PIG23原癌基因在12-泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图45的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图45所示，显示PIG18 mRNA转录物(具有大约4.5kb大小的优势PIG18mRNA转录物)在正常组织，如脑、心脏、肌肉、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞中很少表达或不表达。
图66示出确定PIG23原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图66的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图66所示，显示PIG23mRNA转录物(具有大约4.5kb大小的优势PIG23 mRNA转录物)在HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中有非常高的表达。而且，显示具有大约7.0kb和2.0kb大小的PIG23mRNA转录物同时在HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中以升高的水平表达。
图25显示确定PIG27原癌基因在正常外宫颈组织、子宫颈癌组织、宫颈部淋巴结转移性组织和子宫颈癌细胞系(CaSki和CUMC-6)是否表达的RNA印迹结果。如图25所示，显示PIG27原癌基因的表达水平升高，即，具有大约1.5kb大小的优势PIG27 mRNA转录物在子宫颈癌组织和子宫颈癌细胞系CaSki和CUMC-6中过表达。在图25中，“正常”泳道表示正常外宫颈组织，“癌”泳道表示子宫颈癌组织，“转移”泳道表示宫颈部淋巴结转移性组织，以及“CaSki”和“CUMC-6”泳道各表示子宫癌细胞系。图25的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图46示出确定PIG27原癌基因在12-泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图46的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图46所示，显示PIG27 mRNA转录物(具有大约1.5kb大小的优势PIG27mRNA转录物)在正常组织，如脑、心脏、肌肉、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞中很少表达。
图67示出确定PIG27原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图67的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图67所示，显示PIG27 mRNA转录物(具有大约1.5kb大小的优势PIG27 mRNA转录物)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中有非常高的表达。
图26显示确定PIG28原癌基因在正常外宫颈组织、子宫颈癌组织、宫颈部淋巴结转移性组织和子宫颈癌细胞系(CaSki和CUMC-6)是否表达的RNA印迹结果。如图26所示，显示PIG28原癌基因的表达水平升高，即，具有大约1.5kb大小的优势PIG28 mRNA转录物在子宫颈癌组织和子宫颈癌细胞系CaSki和CUMC-6中过表达。在图26中，“正常”泳道表示正常外宫颈组织，“癌”泳道表示子宫颈癌组织，“转移”泳道表示宫颈部淋巴结转移性组织，以及“CaSki”和“CUMC-6”泳道各表示子宫癌细胞系。图26的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图47示出确定PIG28原癌基因在12-泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图47的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图47所示，显示PIG28 mRNA转录物(具有大约1.5kb大小的优势PIG28mRNA转录物)在正常组织，如脑、心脏、肌肉、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞中很少表达或不表达。而且，显示具有大约2.2kb大小的PIG28 mRNA转录物同时在正常组织，如脑、心脏、肌肉、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞中很少表达或不表达。
图68示出确定PIG28原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图68的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图68所示，显示PIG28 mRNA转录物(具有大约1.5kb大小的优势PIG28 mRNA转录物)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中有非常高的表达。而且，显示2.2kb大小的PIG28 mRNA转录物同时在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中以升高的水平的表达。
图39显示确定GIG9原癌基因在正常外宫颈组织、子宫颈癌组织、宫颈部淋巴结转移性组织和子宫颈癌细胞系(CaSki和CUMC-6)是否表达的RNA印迹结果。如图39所示，显示GIG9原癌基因的表达水平升高，即，具有大约1.5kb大小的优势GIG9 mRNA转录物在子宫颈癌组织和子宫颈癌细胞系CaSki和CUMC-6中过表达。在图39中，“正常”泳道表示正常外宫颈组织，“癌”泳道表示子宫颈癌组织，“转移”泳道表示宫颈部淋巴结转移性组织，以及“CaSki”和“CUMC-6”泳道各表示子宫癌细胞系。图39的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图60示出确定GIG9原癌基因在12-泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图60的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图60所示，显示GIG9 mRNA转录物(具有大约1.5kb大小的优势GIG9mRNA转录物)在正常组织，如脑、心脏、肌肉、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞中很少表达。
图81示出确定GIG9原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图81的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图81所示，显示GIG9 mRNA转录物(具有大约1.5kb大小的优势GIG9 mRNA转录物)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中有非常高的表达。
7-3.PIG38、PIG43、PIG44、PIG54和GIG18 以与实施例1-3相同的方式从正常肝组织、肝癌组织和肝癌细胞系HepG2中提取总RNA样品。
为了确定各PIG基因的表达水平，将20μg从组织和细胞系中提取的变性的各总RNA样品在1％甲醛琼脂糖凝胶中电泳，且然后将得到的琼脂糖凝胶转移到尼龙膜(Boehringer-Mannheim，德国)。然后将印迹与使用Rediprime II随机引物标记系统(Amersham，英国)制备的32P-标记的随机引物HP103 cDNA探针杂交。将RNA印迹分析重复两次，并然后将得到的印迹用光密度计定量并用β-肌动蛋白标准化。
图29显示确定PIG38原癌基因在正常肝组织、肝癌组织和肝癌细胞系(HepG2)是否表达的RNA印迹结果。如图29所示，显示出在肝癌组织和肝癌细胞系HepG2中PIG38原癌基因高表达，而在正常组织中不表达或很少表达。图29的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图50示出确定PIG38原癌基因在12-泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图50的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图50所示，显示PIG38 mRNA转录物(大约1.5kb)在如肝组织的多种正常组织中不表达或很少表达。图71示出确定PIG38原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图71的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图71所示，显示PIG38 mRNA转录物(大约1.5kb)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。而且，显示另外的具有大约2.5kb、3kb和4.5kb大小的PIG38 mRNA转录物同时在癌细胞系中表达。
图31显示确定PIG43原癌基因在正常肝组织、肝癌组织和肝癌细胞系(HepG2)是否表达的RNA印迹结果。如图31所示，显示出在肝癌组织和肝癌细胞系HepG2中PIG43原癌基因高表达，而在正常组织中不表达或很少表达。图31的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图52示出确定PIG43原癌基因在12-泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图52的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图52所示，显示PIG43 mRNA转录物(大约3.0kb)在如肝组织的多种正常组织中不表达或很少表达。图73示出确定PIG43原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图73的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图73所示，显示PIG43 mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、结肠癌细胞系SW480和皮肤癌细胞系G361中高表达，而在伯基特淋巴瘤细胞系Raji和肺癌细胞系A549中不表达。
图32显示确定PIG44原癌基因在正常肝组织、肝癌组织和肝癌细胞系(HepG2)是否表达的RNA印迹结果。如图32所示，显示出在肝癌组织和肝癌细胞系HepG2中PIG44原癌基因高表达，而在正常组织中不表达或很少表达。图32的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图53示出确定PIG44原癌基因在12-泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图53的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图53所示，显示PIG44 mRNA转录物(大约4.5kb)在如肝组织的多种正常组织中不表达或很少表达，但只在正常心脏和肌肉中很少表达。而且，显示具有大约5.0kb大小的PIG38 mRNA转录物在正常心脏和肌肉中很少表达。图74示出确定PIG38原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图74的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图74所示，显示PIG44 mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。而且，显示具有大约5.0kb大小的PIG44 mRNA转录物同时表达。
图37显示确定PIG54原癌基因在正常肝组织、肝癌组织和肝癌细胞系(HepG2)是否表达的RNA印迹结果。如图37所示，显示出在肝癌组织和肝癌细胞系HepG2中PIG38原癌基因高表达，而在正常组织中不表达或很少表达。图37的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图58示出确定PIG54原癌基因在12-泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图58的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图58所示，显示PIG54 mRNA转录物(大约7.0kb)在如肝组织的多种正常组织中不表达或很少表达。而且，显示具有大约9.0kb大小的PIG54 mRNA转录物同时很少表达。图79示出确定PIG38原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图79的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图79所示，显示PIG54 mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。而且，显示具有大约9.0kb和3.0kb大小的PIG54mRNA转录物同时表达。
图41显示确定GIG18原癌基因在正常肝组织、肝癌组织和肝癌细胞系(HepG2)是否表达的RNA印迹结果。如图41所示，显示出在肝癌组织和肝癌细胞系HepG2中GIG18原癌基因高表达，而在正常组织中很少表达。图41的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图62示出确定GIG18原癌基因在12-泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图62的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图62所示，显示GIG18 mRNA转录物(大约2.2kb)在如肝组织的多种正常组织中不表达或很少表达。而且，显示具有大约2.0kb大小的GIG18mRNA转录物同时很少表达。图83示出确定GIG18原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图83的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图83所示，显示GIG18 mRNA转录物(大约2.2kb)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。而且，显示具有大约2.0kb大小的GIG18 mRNA转录物同时在癌细胞系高表达。
7-4.PIG40 以与实施例1-4相同的方式从正常外周血组织、白血病组织和K-562细胞中提取总RNA样品。
为了确定PIG40基因的表达水平，将20μg从组织和细胞系中提取的变性的各总RNA样品在1％甲醛琼脂糖凝胶中电泳，且然后将得到的琼脂糖凝胶转移到尼龙膜(Boehringer-Mannheim，德国)。然后将印迹与使用Rediprime II随机引物标记系统(Amersham，英国)制备的32P-标记的随机引物全长PIG40cDNA探针杂交。将RNA印迹分析重复两次，并然后将得到的印迹用光密度计定量并用β-肌动蛋白标准化。
图30显示确定PIG40原癌基因在正常外周血组织、白血病组织和K-562细胞是否表达的RNA印迹结果。如图30所示，显示出PIG40原癌基因的表达水平升高，即，具有2.5kb大小的优势PIG40 mRNA转录物在白血病组织和K-562细胞系中过表达。在图30中，“正常”泳道表示正常外周血组织，“癌”泳道表示白血病组织，以及“K562”泳道表示白血病细胞系。图30的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图51示出确定PIG40原癌基因在12-泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图51的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图51所示，显示PIG40 mRNA转录物(具有大约2.5kb大小的优势PIG40mRNA转录物)在多种正常组织，如脑、心脏、肌肉、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中很少表达或不表达。
图72示出确定PIG40原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图72的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图72所示，显示PIG40 mRNA转录物(具有大约2.5kb大小的优势PIG40 mRNA转录物)在HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。而且，显示具有大约2.0kb大小的PIG40 mRNA转录物同时在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中以升高的水平表达。
7-5.HLC-9和MIG22 以与实施例1相同的方式从正常肺组织、左肺癌组织、从左肺转移道右肺的转移性肺癌组织以及肺癌细胞系A549、NCI-H2009(美国典型培养物保藏中心；ATCC号CRL-5911)和NCI-H441(美国典型培养物保藏中心；ATCC号HTB-174)中提取总RNA样品。
为了确定各HLC9或MIG22基因的表达水平，将20μg从组织和细胞系中提取的变性的各总RNA样品在1％甲醛琼脂糖凝胶中电泳，且然后将得到的琼脂糖凝胶转移到尼龙膜(Boehringer-Mannheim，德国)。然后将印迹与使用Rediprime II随机引物标记系统(Amersham，英国)制备的32P-标记的随机引物部分L738或L690 cDNA探针杂交。将RNA印迹分析重复两次，并然后将得到的印迹用光密度计定量并用β-肌动蛋白标准化。
图40显示确定HLC9原癌基因在正常肺组织、肺癌组织、转移性肺癌组织和肺癌细胞系(A549、NCI-H2009和NCI-H441)是否表达的RNA印迹结果。如图40所示，显示HLC9原癌基因在肺癌组织、转移性肺癌组织和肺癌细胞系A549、NCI-H2009和NCI-H441中高表达，而在正常肺组织中很少表达或不表达。在图40中，“正常”泳道表示正常肺组织，“癌”泳道表示肺癌组织，“转移”泳道表示转移性肺癌组织，以及“A549”、“NCI-H2009”和“NCI-H441”泳道表示肺癌细胞系。图40的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图61示出确定HLC9原癌基因在12-泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图61的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图61所示，显示HLC9 mRNA转录物(大约2.5kb)在如肌肉、心脏和胎盘的正常组织中表达，且在其它正常组织中非常表达或不表达。而且，显示具有大约4.4kb大小的另一个HLC9 mRNA转录物同时在正常组织中很少表达或不表达。
图82示出确定HLC9原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图82的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图82所示，显示HLC9 mRNA转录物(大约1.5kb)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。而且，显示另外的具有4.4kb的另一个HLC9 mRNA转录物同时在癌细胞系中高表达。
图42显示确定MIG22原癌基因在正常肺组织、肺癌组织、转移性肺癌组织和肺癌细胞系(A549和NCI-H358)是否表达的RNA印迹结果。如图42所示，显示MIG22原癌基因在肺癌组织、转移性肺癌组织和肺癌细胞系A549和NCI-H358中高表达，而在正常肺组织中很少表达或不表达。在图42中，“正常”泳道表示正常肺组织，“癌”泳道表示肺癌组织，“转移”泳道表示转移性肺癌组织，以及“A549”和“NCI-H358”泳道表示肺癌细胞系。图42的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图63示出确定MIG22原癌基因在12-泳道正常人多种组织(Clontech)，例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图63的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图63所示，显示MIG22 mRNA转录物(具有大约1.0kb大小的转录物)在正常组织中很少表达或不表达。
图84示出确定MIG22原癌基因在人癌细胞系，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图84的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图84所示，显示MIG22 mRNA转录物(具有大约1.0kb大小的优势转录物和具有大约5.0kb和8.0kb大小的另外的转录物)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中有非常高的表达。
实施例8用原癌基因转化大肠杆菌后表达的蛋白质大小的确定将各SEQ ID NO1的PIG12原癌基因；SEQ ID NO5的PIG18原癌基因；SEQ ID NO9的PIG23原癌基因；SEQ ID NO13的PIG27原癌基因；SEQ IDNO17的PIG28原癌基因；SEQ ID NO21的PIG30原癌基因；SEQ ID NO25的PIG31原癌基因；SEQ ID NO29的PIG38原癌基因；SEQ ID NO33的PIG40原癌基因；SEQ ID NO37的PIG43原癌基因；SEQ ID NO41的PIG44原癌基因；SEQ ID NO45的PIG46原癌基因；SEQ ID NO49的PIG47原癌基因；SEQ ID NO53的PIG48原癌基因；SEQ ID NO57的PIG50原癌基因；SEQ ID NO61的PIG54原癌基因；SEQ ID NO65的PIG55原癌基因；SEQID NO69的GIG9原癌基因；SEQ ID NO73的HLC-9原癌基因；SEQ ID NO77的GIG18原癌基因以及SEQ ID NO81的MIG22原癌基因插入到pBAD/thio-TOPO载体(Invitrogen)的多克隆位点，且然后用各得到的表达载体转化大肠杆菌。将各转化的大肠杆菌菌株在LB培养基中振荡培养，然后将得到的各培养物以1/100的比率稀释并再培养3小时。向其中加入1mM异丙基β-D-硫代半乳糖吡喃糖苷(IPTG，Sigma)以促进其蛋白质的产生。在IPTG诱导前/后将大肠杆菌细胞在培养基中超声处理，然后将超声处理的匀浆进行12％十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)。根据引用的参考文献(Sambrook，J.等人，Molecular CloningA Laboratory manual，纽约冷泉港实验室(1989))中描述的方法，在从培养基得到蛋白质样品后进行SDS-PAGE。
图85为示出PIG12蛋白质的SDS-PAGE分析结果的图。在图85中，泳道1表示IPTG诱导前的蛋白质样品，且泳道2表示由IPTG诱导的PIG12基因表达后的蛋白质样品。如图85所示，表达的PIG12蛋白质具有大约46kDa的分子量，其对应于来自其DNA序列的分子量。
图86示出确定在用pBAD/thio-Topo/PIG18载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果，其中在L-阿拉伯糖诱导后清楚地观察到具有大约22kDa分子量的融合蛋白条带。15-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约7kDa分子量的PIG18蛋白质，各被插入到pBAD/thio-Topo/PIG18载体中的蛋白质。
图87示出确定在用pBAD/thio-Topo/PIG28载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果，其中在L-阿拉伯糖诱导后清楚地观察到具有大约85kDa分子量的融合蛋白条带。85-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约70kDa分子量的PIG23蛋白质，各被插入到pBAD/thio-Topo/PIG23载体中的蛋白质。
图88示出确定在用pBAD/thio-Topo/PIG27载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果，其中在L-阿拉伯糖诱导后清楚地观察到具有大约27kDa分子量的融合蛋白条带。27-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约12kDa分子量的PIG27蛋白质，各被插入到pBAD/thio-Topo/PIG27载体中的蛋白质。
图89示出确定在用pBAD/thio-Topo/PIG28载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果，其中在L-阿拉伯糖诱导后清楚地观察到具有大约51kDa分子量的融合蛋白条带。51-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约36kDa分子量的PIG28蛋白质，各被插入到pBAD/thio-Topo/PIG28载体中的蛋白质。
图90为示出PIG30蛋白质的SDS-PAGE分析结果的图。在图90中，泳道1表示IPTG诱导前的蛋白质样品，且泳道2表示由IPTG诱导的PIG30基因表达后的蛋白质样品。如图90所示，表达的PIG30蛋白质具有大约82kDa的分子量，其对应于来自其DNA序列的分子量。
图91为示出PIG31蛋白质的SDS-PAGE分析结果的图。在图91中，泳道1表示IPTG诱导前的蛋白质样品，且泳道2表示由IPTG诱导的PIG31基因表达后的蛋白质样品。如图91所示，表达的PIG31蛋白质具有大约83kDa的分子量，其对应于来自其DNA序列的分子量。
图92示出确定在用pBAD/thio-Topo/PIG38载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果，其中在L-阿拉伯糖诱导后清楚地观察到具有大约88kDa分子量的融合蛋白条带。88-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约73kDa分子量的PIG38蛋白质，各被插入到pBAD/thio-Topo/PIG38载体中的蛋白质。
图93示出确定在用pBAD/thio-Topo/PIG40载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果，其中在L-阿拉伯糖诱导后清楚地观察到具有大约72kDa分子量的融合蛋白条带。72-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约57kDa分子量的PIG38蛋白质，各被插入到pBAD/thio-Topo/PIG40载体中的蛋白质。
图94示出确定在用pBAD/thio-Topo/PIG43载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果，其中在L-阿拉伯糖诱导后清楚地观察到具有大约41kDa分子量的融合蛋白条带。41-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约26kDa分子量的PIG43蛋白质，各被插入到pBAD/thio-Topo/PIG43载体中的蛋白质。
图95示出确定在用pBAD/thio-Topo/PIG44载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果，其中在L-阿拉伯糖诱导后清楚地观察到具有大约70kDa分子量的融合蛋白条带。70-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约55kDa分子量的PIG38蛋白质，各被插入到pBAD/thio-Topo/PIG44载体中的蛋白质。
图96为示出PIG46蛋白质的SDS-PAGE分析结果的图。在图96中，泳道1表示IPTG诱导前的蛋白质样品，且泳道2表示由IPTG诱导的PIG46基因表达后的蛋白质样品。如图96所示，表达的PIG46蛋白质具有大约48kDa的分子量，其对应于来自其DNA序列的分子量。
图97为示出PIG47蛋白质的SDS-PAGE分析结果的图。在图97中，泳道1表示IPTG诱导前的蛋白质样品，且泳道2表示由IPTG诱导的PIG47基因表达后的蛋白质样品。如图97所示，表达的PIG47蛋白质具有大约29kDa的分子量，其对应于来自其DNA序列的分子量。
图98为示出PIG48蛋白质的SDS-PAGE分析结果的图。在图98中，泳道1表示IPTG诱导前的蛋白质样品，且泳道2表示由IPTG诱导的PIG48基因表达后的蛋白质样品。如图98所示，表达的PIG48蛋白质具有大约60kDa的分子量，其对应于来自其DNA序列的分子量。
图99为示出PIG50蛋白质的SDS-PAGE分析结果的图。在图99中，泳道1表示IPTG诱导前的蛋白质样品，且泳道2表示由IPTG诱导的PIG50基因表达后的蛋白质样品。如图99所示，表达的PIG50蛋白质具有大约22kDa的分子量，其对应于来自其DNA序列的分子量。
图100示出确定在用pBAD/thio-Topo/PIG54载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果，其中在L-阿拉伯糖诱导后清楚地观察到具有大约84kDa分子量的融合蛋白条带。84-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约69kDa分子量的PIG54蛋白质，各被插入到pBAD/thio-Topo/PIG54载体中的蛋白质。
图101为示出PIG55蛋白质的SDS-PAGE分析结果的图。在图101中，泳道1表示IPTG诱导前的蛋白质样品，且泳道2表示由IPTG诱导的PIG55基因表达后的蛋白质样品。如图101所示，表达的PIG55蛋白质具有大约18kDa的分子量，其对应于来自其DNA序列的分子量。
图102示出确定在用pBAD/thio-Topo/GIG9载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果，其中在L-阿拉伯糖诱导后清楚地观察到具有大约53kDa分子量的融合蛋白条带。53-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约38kDa分子量的GIG9蛋白质，各被插入到pBAD/thio-Topo/GIG9载体中的蛋白质。
图103示出确定在用pBAD/thio-Topo/HLC9载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果，其中在L-阿拉伯糖诱导后清楚地观察到具有大约66kDa分子量的融合蛋白条带。66-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约51kDa分子量的HLC9蛋白质，各被插入到pBAD/thio-Topo/HLC9载体中的蛋白质。
图104示出确定在用pBAD/thio-Topo/GIG18载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果，其中在L-阿拉伯糖诱导后清楚地观察到具有大约61kDa分子量的融合蛋白条带。61-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约46kDa分子量的GIG18蛋白质，各被插入到pBAD/thio-Topo/GIG18载体中的蛋白质。
图105示出确定在用pBAD/thio-Topo/MIG22载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果，其中在L-阿拉伯糖诱导后清楚地观察到具有大约42kDa分子量的融合蛋白条带。42-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约27kDa分子量的MIG22蛋白质，各被插入到pBAD/thio-Topo/MIG22载体中的蛋白质。
工业实用性本发明的原癌基因可有效地用于诊断包括乳腺癌、白血病、子宫癌、肺癌、恶性淋巴瘤等的多种癌症。
序列表
<110>金弦起(KIM，HYUN-KEE)
<120>人类原癌基因及其编码的蛋白质
<130>PCT06-023
<150>KR10-2005-0026244
<151>2005-03-30
<160>84
<170>KopatentIn 1.71
<210>1
<211>1258
<212>DNA
<213>人类
<400>1
gcctccaagg tttgtcttga agcatagctc cagctggagg gtacctttta agctgttcaa60
ggtcaagatg aatacaaact caaaggaggt tttatccctg ggtgttcaag ttcccgaggc120
atgggaagaa cttctgacaa tgaaagtgga agcaaaaagt caccttcaat ggcaggaatc180
cagactgaaa cgcagtaatc cactggcaag ggaaatcttc cgaaggcact ttcgacagct240
gtgctaccaa gagacccctg gaccaaggga ggctcttact cgactccagg aactttgcta300
ccagtggttg aggccacatg tgagcacaaa ggagcagatt ttggatctgc tggtgctgga360
gcagtttcta tccattctgc ccaaggagct ccagggctgg gtgagggaac actgtccaga420
gagtggagaa gaggctgtga ttttgctgga ggatctggag agagagctcg atgaaccaca480
acatgagatg gtggcccaca gacacagaca agaagtcctc tgtaaagaga tggtgcctct540
agcagagcag acaccactga cccttcagtc ccagcctaag gagccacagc tcacatgtga600
ctctgctcag aagtgccatt ctattggaga gacagatgaa gtaaccaaga ctgaggacag660
agagttggtg ctaaggaaag actgtcctaa gatagtggaa ccacatggga aaatgtttaa720
tgagcagacc tgggaggtat cacagcagga tccctcacat ggagaagttg gtgaacataa780
ggataggata gagaggcagt ggggaaacct cttaggagag gggcaacaca aatgtgatga840
atgtgggaag agctttactc agagctcagg tctcattcga catcaaagaa ttcatactgg900
agaaagacct tatgaatgta atgaatgtgg gaaagccttc agtcgaagtt ctggtctttt960
taatcaccga ggaatccaca atatacagaa acggtaccac tgcaaggagt gtgggaaggt1020
cttcagtcag agtgcgggtc ttatccagca tcagagaatc cacaaaggag aaaagccgta1080
tcagtgcagc cagtgcagta agagctacag tcggcgttca tttctcattg aacatcagag1140
aagccacaca ggggagcgac ctcaccagtg cattgaatgt gggaaaagct ttaatcgaca1200
ctgcaacctc attcgccatc agaagatcca cacagtggct gagctggtct agggcttg 1258
<210>2
<211>394
<212>PRT
<213>人类
<400>2
Met Asn Thr Asn Ser Lys Glu Val Leu Ser Leu Gly Val Gln Val Pro
1 5 10 15
Glu Ala Trp Glu Glu Leu Leu Thr Met Lys Val Glu Ala Lys Ser His
20 25 30
Leu Gln Trp Gln Glu Ser Arg Leu Lys Arg Ser Asn Pro Leu Ala Arg
35 40 45
Glu Ile Phe Arg Arg His Phe Arg Gln Leu Cys Tyr Gln Glu Thr Pro
50 55 60
Gly Pro Arg Glu Ala Leu Thr Arg Leu Gln Glu Leu Cys Tyr Gln Trp
65 70 75 80
Leu Arg Pro His Val Ser Thr Lys Glu Gln Ile Leu Asp Leu Leu Val
85 90 95
Leu Glu Gln Phe Leu Ser Ile Leu Pro Lys Glu Leu Gln Gly Trp Val
100 105 110
Arg Glu His Cys Pro Glu Ser Gly Glu Glu Ala Val Ile Leu Leu Glu
115 120 125
Asp Leu Glu Arg Glu Leu Asp Glu Pro Gln His Glu Met Val Ala His
130 135 140
Arg His Arg Gln Glu Val Leu Cys Lys Glu Met Val Pro Leu Ala Glu
145 150 155 160
Gln Thr Pro Leu Thr Leu Gln Ser Gln Pro Lys Glu Pro Gln Leu Thr
165 170 175
Cys Asp Ser Ala Gln Lys Cys His Ser Ile Gly Glu Thr Asp Glu Val
180 185 190
Thr Lys Thr Glu Asp Arg Glu Leu Val Leu Arg Lys Asp Cys Pro Lys
195 200 205
Ile Val Glu Pro His Gly Lys Met Phe Asn Glu Gln Thr Trp Glu Val
210 215 220
Ser Gln Gln Asp Pro Ser His Gly Glu Val Gly Glu His Lys Asp Arg
225 230 235 240
Ile Glu Arg Gln Trp Gly Asn Leu Leu Gly Glu Gly Gln His Lys Cys
245 250 255
Asp Glu Cys Gly Lys Ser Phe Thr Gln Ser Ser Gly Leu Ile Arg His
260 265 270
Gln Arg Ile His Thr Gly Glu Arg Pro Tyr Glu Cys Asn Glu Cys Gly
275 280 285
Lys Ala Phe Ser Arg Ser Ser Gly Leu Phe Asn His Arg Gly Ile His
290 295 300
Asn Ile Gln Lys Arg Tyr His Cys Lys Glu Cys Gly Lys Val Phe Ser
305 310 315 320
Gln Ser Ala Gly Leu Ile Gln His Gln Arg Ile His Lys Gly Glu Lys
325 330 335
Pro Tyr Gln Cys Ser Gln Cys Ser Lys Ser Tyr Ser Arg Arg Ser Phe
340 345 350
Leu Ile Glu His Gln Arg Ser His Thr Gly Glu Arg Pro His Gln Cys
355 360 365
Ile Glu Cys Gly Lys Ser Phe Asn Arg His Cys Asn Leu Ile Arg His
370 375 380
Gln Lys Ile His Thr Val Ala Glu Leu Val
385 390
<210>3
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG12的锚定引物
<400>3
aagctttttt ttttta 16
<210>4
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG12的H-AP21引物
<400>4
aagctttctc tgg 13
<210>5
<211>2403
<212>DNA
<213>人类
<400>5
cccagcagtt ataacagcag tgggcagttg atggcaagta aaatggatac ctgctctagt60
aacctgaata acagcatata caaaaagctg ttaacttagg aaaagggact gctgggaggt120
taaaaagaaa agtttataaa agtgaataac ctgaggattc tattagtccc cacccaaact180
ttattgattc acctcctaaa acaacagatg tacgacttgc atacctgctt tttatgggag240
ctgtcaagca tgtatttttg tcaattacca gaaagataac aggacgagat gacggtgtta300
ttccaaggga atattgccaa tgctacagta ataaatgaat gtcacttctg gatatagcta360
ggtgacatat acatacttac atgtgtgtat atgtagatgt atgcacacac atatattatt420
tgcagtgcag tatagaatag gcactttaaa acactctttc cccgcacccc agcaattatg480
aaaataatct ctgattccct gatttaatat gcaaagtcta ggttggtaga gtttagccct540
gaacatttca tggtgttcat caacagtgag agactccata gtttgggctt gtaccacttt600
tgcaaataag tgtattttga aattgtttga cggcaaggtt taagttatta agaggtaaga660
cttagtacta tctgtgcgta gaagttctag tgttttcaat tttaaacata tccaagtttg720
aattcctaaa attatggaaa cagatgaaaa gcctctgttt tgatatgggt agtatttttt780
acattttaca cactgtacac ataagccaaa actgagcata agtcctctag tgaatgtagg840
ctggctttca gagtaggcta ttcctgagag ctgcatgtgt ccgcccccga tggaggactc900
caggcagcag acacatgcca gggccatgtc agacacagat tggccagaaa ccttcctgct960
gagcctcaca gcagtgagac tggggccact acatttgctc catcctcctg ggattggctg1020
tgaactgatc atgtttatga gaaactggca aagcagaatg tgatatccta ggaggtaatg1080
accatgaaag acttctctac ccatcttaaa aacaacgaaa gaaggcatgg acttctggat1140
gcccatccac tgggtgtaaa cacatctagt agttgttctg aaatgtcagt tctgatatgg1200
aagcacccat tatgcgctgt ggccactcca ataggtgctg agtgtacaga gtggaataag1260
acagagacct gccctcaaga gcaaagtaga tcatgcatag agtgtgatgt atgtgtaata1320
aatatgtttc acacaaacaa ggcctgtcag ctaaagaagt ttgaacattt gggttactat1380
ttcttgtggt tataacttaa tgaaaacaat gcagtacagg acatatattt tttaaaataa1440
gtctgattta attgggcact atttatttac aaatgttttg ctcaatagat tgctcaaatc1500
aggttttctt ttaagaatca atcatgtcag tctgcttaga aataacagaa gaaaatagaa1560
ttgacattga aatctaggaa aattattcta taatttccat ttacttaaga cttaatgaga1620
ctttaaaagc attttttaac ctcctaagta tcaagtatag aaaatcttca tggaattcac1680
aaagtaattt ggaaattagg ttgaaacata tctcttatct tacgaaaaaa tggtagcatt1740
ttaaacaaaa tagaaagttg caaggcaaat gtttatttaa aagagcaggc caggcgcggt1800
ggctcacgcc tgtaatccca gcactttggg aggctgaggc gggtggatca cgaggtcagg1860
agatcgagac catcctggct aacacggtga aacccgtctc tactaaaaat gcaaaaaaaa1920
ttagccgggc gtggtggcag gcacctgtag tcccagctac tcgggaggct gaggcaggag1980
actggcgtga acccaggagg cggaccttgt agtgagccga gatcgcgcca ctgtgctcca2040
gcctgggcaa cagagcaaga ctccatctca aaaaataaaa ataaataaaa aataaaaaaa2100
taaaagagca aactatttcc aaataccata gaataactta cataaaagta atataactgt2160
attgtaagta gaagctagca ctggttttat taatttagtg actattcatt ttatctaaat2220
cagtgaagat ttactgtcat tgtttattag tctgtatata ttaaaatatg atatcattaa2280
tgtacttaca aaatagtatg tcactgtttt tatgttcatt cttaaaaaca taacctgtat2340
taataaatgt gaacatttgc ttggtaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa2400
aaa 2403
<210>6
<211>167
<212>PRT
<213>人类
<400>6
Met Cys Pro Pro Pro Met Glu Asp Ser Arg Gln Gln Thr His Ala Arg
1 5 10 15
Ala Met Ser Asp Thr Asp Trp Pro Glu Thr Phe Leu Leu Ser Leu Thr
20 25 30
Ala Val Arg Leu Gly Pro Leu His Leu Leu His Pro Pro Gly Ile Gly
35 40 45
Cys Glu Leu Ile Met Phe Met Arg Asn Trp Gln Ser Arg Met Met Thr
50 55 60
Met Lys Asp Phe Ser Thr His Leu Lys Asn Asn Glu Arg Arg His Gly
65 70 75 80
Leu Leu Asp Ala His Pro Leu Gly Val Asn Thr Ser Ser Ser Cys Ser
85 90 95
Glu Met Ser Val Leu Ile Trp Lys His Pro Leu Cys Ala Val Ala Thr
100 105 110
Pro Ile Gly Ala Glu Cys Thr Glu Trp Asn Lys Thr Glu Thr Cys Pro
115 120 125
Gln Glu Gln Ser Arg Ser Cys Ile Glu Cys Asp Val Cys Val Ile Asn
130 135 140
Met Phe His Thr Asn Lys Ala Cys Gln Leu Lys Lys Phe Glu His Leu
145 150 155 160
Gly Tyr Tyr Phe Leu Trp Leu
165
<210>7
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG18的锚定引物
<400>7
aagctttttt tttttc 16
<210>8
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG18的H-AP11引物
<400>8
aagcttcggg taa13
<210>9
<211>2150
<212>DNA
<213>人类
<400>9
gcggacagtg cggaactaaa gcaaatggtt atgagcctta gagtttctga actccaagta60
ctgttgggct acgccgggag aaacaagcac ggacgcaaac acgaacttct cacaaaagcc120
ctgcatttgc taaaggctgg ctgtagtcct gctgtgcaaa tgaaaattaa ggaactctat180
aggcggcggt tcccacagaa aatcatgacg cctgcagact tgtccatccc caacgtacat240
tcaagtccta tgccagcaac tttgtctcca tctaccattc cacaactcac ttacgatggt300
caccctgcat catcgccatt actccctgtt tctcttctgg gacctaaaca tgaactggaa360
ctcccacatc ttacatcagc tcttcaccca gtccatccgg atataaaact tcaaaaatta420
ccattttatg atttactgga tgaactgata aaacccacca gtctagcatc agacaacagt480
cagcgctttc gagaaacctg ttttgcattt gccttgacac cacaacaagt gcagcaaatc540
agtagttcca tggatatttc tgggaccaaa tgtgacttca cagtacaggt ccagttaagg600
ttttgtttat cagaaaccag ttgtccacaa gaagatcact tcccacccaa tctttgtgtg660
aaagtgaata caaaaccttg cagccttcca ggttaccttc cacctacaaa aaatggcgtg720
gaaccaaagc gacccagccg accaattaat atcacctcac ttgtccgact gtccacaaca780
gtaccaaaca cgattgttgt ttcttggact gcagaaattg gaagaaacta ttccatggca840
gtatatcttg taaaacagtt gtcctcaaca gttcttcttc agaggttacg agcaaaggga900
ataaggaatc cggatcattc tagagcttta attaaagaga agttgactgc ggatccagac960
agtgaaatag ctacaaccag cctaagggtt tctctactat gtccacttgg taaaatgcgg1020
ctgacaattc cgtgtcgggc ccttacatgt tctcatctac aatgttttga cgcaactctt1080
tacattcaga tgaatgagaa aaaaccaacc tgggtttgtc ctgtctgtga taagaaggct1140
ccatatgaac accttattat tgatggcttg tttatggaaa tcctaaagta ctgtacagac1200
tgtgatgaaa tacaatttaa ggaggatggc acttgggcac cgatgagatc aaaaaaggaa1260
gtacaggaag tttctgcctc ttacaatgga gtcgatggat gcttgagctc cacattggag1320
catcaggtag cgtctcacca ccagtcctca aataaaaaca agaaagtaga agtgattgac1380
ctaaccatag acagttcatc tgatgaagag gaagaagagc catctgccaa gaggacctgt1440
ccttccctat ctcccacatc accactaaat aataaaggca ttttaagtct tccacatcaa1500
gcatctccag tatcccgcac cccaagcctt cctgctgtag acacaagcta cattaatacc1560
tccctcatcc aagactatag gcatcctttc cacatgacac ccatgcctta cgacttacaa1620
ggattagatt tctttccttt cttatcagga gacaatcagc attacaacac ctccttgctt1680
gccgctgcag cagcagcagt ttcagatgat caagacctcc tacactcgtc tcggtttttc1740
ccgtatacct cctcacagat gtttcttgat cagttaagtg caggaggcag tacttctctg1800
ccaaccacca atggaagcag tagtggcagt aacagcagcc tggtttcttc caacagccta1860
agggaaagcc atagccacac cgtcacaaac aggagcagca cggacacggc atccatcttt1920
ggcatcatac cagacattat ttcattggac tgattcccag gccctgctgc tcccatcccc1980
accccagatc gaatgaactt ggcagaaaga agagaacttt gtgctctgtt ttaccttact2040
ctgtttagaa aagtatacaa gcgtgttttt tttccttttt ttagggaaaa aattaaaaga2100
aatgtacaga gaaaaaaata aaaaaaaaat aaaaaaaaaa aaaaaaaaaa2150
<210>10
<211>642
<212>PRT
<213>人类
<400>10
Met Val Met Ser Leu Arg Val Ser Glu Leu Gln Val Leu Leu Gly Tyr
1 5 10 15
Ala Gly Arg Asn Lys His Gly Arg Lys His Glu Leu Leu Thr Lys Ala
20 25 30
Leu His Leu Leu Lys Ala Gly Cys Ser Pro Ala Val Gln Met Lys Ile
35 40 45
Lys Glu Leu Tyr Arg Arg Arg Phe Pro Gln Lys Ile Met Thr Pro Ala
50 55 60
Asp Leu Ser Ile Pro Asn Val His Ser Ser Pro Met Pro Ala Thr Leu
65 70 75 80
Ser Pro Ser Thr Ile Pro Gln Leu Thr Tyr Asp Gly His Pro Ala Ser
85 90 95
Ser Pro Leu Leu Pro Val Ser Leu Leu Gly Pro Lys His Glu Leu Glu
100 105 110
Leu Pro His Leu Thr Ser Ala Leu His Pro Val His Pro Asp Ile Lys
115 120 125
Leu Gln Lys Leu Pro Phe Tyr Asp Leu Leu Asp Glu Leu Ile Lys Pro
130 135 140
Thr Ser Leu Ala Ser Asp Asn Ser Gln Arg Phe Arg Glu Thr Cys Phe
145 150 155 160
Ala Phe Ala Leu Thr Pro Gln Gln Val Gln Gln Ile Ser Ser Ser Met
165 170 175
Asp Ile Ser Gly Thr Lys Cys Asp Phe Thr Val Gln Val Gln Leu Arg
180 185 190
Phe Cys Leu Ser Glu Thr Ser Cys Pro Gln Glu Asp His Phe Pro Pro
195 200 205
Asn Leu Cys Val Lys Val Asn Thr Lys Pro Cys Ser Leu Pro Gly Tyr
210 215 220
Leu Pro Pro Thr Lys Asn Gly Val Glu Pro Lys Arg Pro Ser Arg Pro
225 230 235 240
Ile Asn Ile Thr Ser Leu Val Arg Leu Ser Thr Thr Val Pro Asn Thr
245 250 255
Ile Val Val Ser Trp Thr Ala Glu Ile Gly Arg Asn Tyr Ser Met Ala
260 265 270
Val Tyr Leu Val Lys Gln Leu Ser Ser Thr Val Leu Leu Gln Arg Leu
275 280 285
Arg Ala Lys Gly Ile Arg Asn Pro Asp His Ser Arg Ala Leu Ile Lys
290 295 300
Glu Lys Leu Thr Ala Asp Pro Asp Ser Glu Ile Ala Thr Thr Ser Leu
305 310 315 320
Arg Val Ser Leu Leu Cys Pro Leu Gly Lys Met Arg Leu Thr Ile Pro
325 330 335
Cys Arg Ala Leu Thr Cys Ser His Leu Gln Cys Phe Asp Ala Thr Leu
340 345 350
Tyr Ile Gln Met Asn Glu Lys Lys Pro Thr Trp Val Cys Pro Val Cys
355 360 365
Asp Lys Lys Ala Pro Tyr Glu His Leu Ile Ile Asp Gly Leu Phe Met
370 375 380
Glu Ile Leu Lys Tyr Cys Thr Asp Cys Asp Glu Ile Gln Phe Lys Glu
385 390 395 400
Asp Gly Thr Trp Ala Pro Met Arg Ser Lys Lys Glu Val Gln Glu Val
405 410 415
Ser Ala Ser Tyr Asn Gly Val Asp Gly Cys Leu Ser Ser Thr Leu Glu
420 425 430
His Gln Val Ala Ser His His Gln Ser Ser Asn Lys Asn Lys Lys Val
435 440 445
Glu Val Ile Asp Leu Thr Ile Asp Ser Ser Ser Asp Glu Glu Glu Glu
450 455 460
Glu Pro Ser Ala Lys Arg Thr Cys Pro Ser Leu Ser Pro Thr Ser Pro
465 470 475 480
Leu Asn Asn Lys Gly Ile Leu Ser Leu Pro His Gln Ala Ser Pro Val
485 490 495
Ser Arg Thr Pro Ser Leu Pro Ala Val Asp Thr Ser Tyr Ile Asn Thr
500 505 510
Ser Leu Ile Gln Asp Tyr Arg His Pro Phe His Met Thr Pro Met Pro
515 520 525
Tyr Asp Leu Gln Gly Leu Asp Phe Phe Pro Phe Leu Ser Gly Asp Asn
530 535 540
Gln His Tyr Asn Thr Ser Leu Leu Ala Ala Ala Ala Ala Ala Val Ser
545 550 555 560
Asp Asp Gln Asp Leu Leu His Ser Ser Arg Phe Phe Pro Tyr Thr Ser
565 570 575
Ser Gln Met Phe Leu Asp Gln Leu Ser Ala Gly Gly Ser Thr Ser Leu
580 585 590
Pro Thr Thr Asn Gly Ser Ser Ser Gly Ser Asn Ser Ser Leu Val Ser
595 600 605
Ser Asn Ser Leu Arg Glu Ser His Ser His Thr Val Thr Asn Arg Ser
610 615 620
Ser Thr Asp Thr Ala Ser Ile Phe Gly Ile Ile Pro Asp Ile Ile Ser
625 630 635 640
Leu Asp
<210>11
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG23的锚定引物
<400>11
aagctttttt tttttc 16
<210>12
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG23的H-AP33引物
<400>12
aagcttgctg ctc13
<210>13
<211>446
<212>DNA
<213>人类
<400>13
tggtcacagt ggaaggatca tgggagaaac agaagggaag aaagatgagg ctgattataa60
gcgactgcag accttccctc tggtcaggca ctcggacatg ccagaggaga tgcgcgtgga120
gaccatggag ctatgtgtca cagcctgtga gaaattctcc aacaacaacg agagcgccgc180
caagatgatc aaagagacaa tggacaagaa gttcggctcc tcctggcacg tggtgatcgg240
cgagggcttt gggtttgaga tcacccacga ggtgaagaac ctcctctacc tgtacttcgg300
gggcaccctg gctgtgtgcg tctggaagtg ctcctgacac tctgccccta tttaaaagcc360
tgttgattca agaactttct aaagtatttc cggaagacat ggctaagtat cgaagcatcc420
ggggggagga tcacccgcct tcttaa 446
<210>14
<211>105
<212>PRT
<213>人类
<400>14
Met Gly Glu Thr Glu Gly Lys Lys Asp Glu Ala Asp Tyr Lys Arg Leu
1 5 10 15
Gln Thr Phe Pro Leu Val Arg His Ser Asp Met Pro Glu Glu Met Arg
20 25 30
Val Glu Thr Met Glu Leu Cys Val Thr Ala Cys Glu Lys Phe Ser Asn
35 40 45
Asn Asn Glu Ser Ala Ala Lys Met Ile Lys Glu Thr Met Asp Lys Lys
50 55 60
Phe Gly Ser Ser Trp His Val Val Ile Gly Glu Gly Phe Gly Phe Glu
65 70 75 80
Ile Thr His Glu Val Lys Asn Leu Leu Tyr Leu Tyr Phe Gly Gly Thr
85 90 95
Leu Ala Val Cys Val Trp Lys Cys Ser
100 105
<210>15
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG27的锚定引物
<400>15
aagctttttt ttttta 16
<210>16
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG27的H-AP12引物
<400>16
aagcttgagt gct 13
<210>17
<211>1024
<212>DNA
<213>人类
<400>17
gggtggctga actctgatct tgacctagag tcatggccat ggcaaccaaa ggaggtactg60
tcaaagctgc ttcaggattc aatgccatgg aagatgccca gaccctgagg aaggccatga120
aagggctcgg caccgatgaa gacgccatta ttagcgtcct tgcctaccgc aacaccgccc180
agcgccagga gatcaggaca gcctacaaga gcaccatcgg cagggacttg atagacgacc240
tgaagtcaga actgagtggc aacttcgagc aggtgattgt ggggatgatg acgcccacgg300
tgctgtatga cgtgcaagag ctgcgaaggg ccatgaaggg agccggcact gatgagggct360
gcctaattga gatcctggcc tcccggaccc ctgaggagat ccggcgcata agccaaacct420
accagcagca atatggacgg agccttgaag atgacattcg ctctgacaca tcgttcatgt480
tccagcgagt gctggtgtct ctgtcagctg gtgggaggga tgaaggaaat tatctggacg540
atgctctcgt gagacaggat gcccaggacc tgtatgaggc tggagagaag aaatggggga600
cagatgaggt gaaatttcta actgttctct gttcccggaa ccgaaatcac ctgttgcatg660
tgtttgatga atacaaaagg atatcacaga aggatattga acagagtatt aaatctgaaa720
catctggtag ctttgaagat gctctgctgg ctatagtaaa gtgcatgagg aacaaatctg780
catattttgc tgaaaagctc tataaatcga tgaagggctt gggcaccgat gataacaccc840
tcatcagagt gatggtttct cgagcagaaa ttgacatgtt ggatatccgg gcacacttca900
agagactcta tggaaagtct ctgtactcgt tcatcaaggg tgacacatct ggagactaca960
ggaaagtact gcttgttctc tgtggaggag atgattaaaa taaaaatccc agaaggacag1020
gagg 1024
<210>18
<211>321
<212>PRT
<213>人类
<400>18
Met Ala Met Ala Thr Lys Gly Gly Thr Val Lys Ala Ala Ser Gly Phe
1 5 10 15
Asn Ala Met Glu Asp Ala Gln Thr Leu Arg Lys Ala Met Lys Gly Leu
20 25 30
Gly Thr Asp Glu Asp Ala Ile Ile Ser Val Leu Ala Tyr Arg Asn Thr
35 40 45
Ala Gln Arg Gln Glu Ile Arg Thr Ala Tyr Lys Ser Thr Ile Gly Arg
50 55 60
Asp Leu Ile Asp Asp Leu Lys Ser Glu Leu Ser Gly Asn Phe Glu Gln
65 70 75 80
Val Ile Val Gly Met Met Thr Pro Thr Val Leu Tyr Asp Val Gln Glu
85 90 95
Leu Arg Arg Ala Met Lys Gly Ala Gly Thr Asp Glu Gly Cys Leu Ile
100 105 110
Glu Ile Leu Ala Ser Arg Thr Pro Glu Glu Ile Arg Arg Ile Ser Gln
115 120 125
Thr Tyr Gln Gln Gln Tyr Gly Arg Ser Leu Glu Asp Asp Ile Arg Ser
130 135 140
Asp Thr Ser Phe Met Phe Gln Arg Val Leu Val Ser Leu Ser Ala Gly
145 150 155 160
Gly Arg Asp Glu Gly Asn Tyr Leu Asp Asp Ala Leu Val Arg Gln Asp
165 170 175
Ala Gln Asp Leu Tyr Glu Ala Gly Glu Lys Lys Trp Gly Thr Asp Glu
180 185 190
Val Lys Phe Leu Thr Val Leu Cys Ser Arg Asn Arg Asn His Leu Leu
195 200 205
His Val Phe Asp Glu Tyr Lys Arg Ile Ser Gln Lys Asp Ile Glu Gln
210 215 220
Ser Ile Lys Ser Glu Thr Ser Gly Ser Phe Glu Asp Ala Leu Leu Ala
225 230 235 240
Ile Val Lys Cys Met Arg Asn Lys Ser Ala Tyr Phe Ala Glu Lys Leu
245 250 255
Tyr Lys Ser Met Lys Gly Leu Gly Thr Asp Asp Asn Thr Leu Ile Arg
260 265 270
Val Met Val Ser Arg Ala Glu Ile Asp Met Leu Asp Ile Arg Ala His
275 280 285
Phe Lys Arg Leu Tyr Gly Lys Ser Leu Tyr Ser Phe Ile Lys Gly Asp
290 295 300
Thr Ser Gly Asp Tyr Arg Lys Val Leu Leu Val Leu Cys Gly Gly Asp
305 310 315 320
Asp
<210>19
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG28的锚定引物
<400>19
aagctttttt tttttc16
<210>20
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG28的H-AP12引物
<400>20
aagcttgagt gct 13
<210>21
<211>2152
<212>DNA
<213>人类
<400>21
ccaggatgtc ggaggagatc atcacgccgg tgtactgcac tggggtgtca gcccaagtgc60
agaagcagcg ggccagggag ctgggcctgg gccgccatga gaatgccatc aagtacctgg120
gccaggatta tgagcagctg cgggtgcgat gcctgcagag tgggaccctc ttccgtgatg180
aggccttccc cccggtaccc cagagcctgg gttacaagga cctgggtccc aattcctcca240
agacctatgg catcaagtgg aagcgtccca cggaactgct gtcaaacccc cagttcattg300
tggatggagc tacccgcaca gacatctgcc agggagcact gggggactgc tggctcttgg360
cggccattgc ctccctcact ctcaacgaca ccctcctgca ccgagtggtt ccgcacggcc420
agagcttcca gaatggctat gccggcatct tccatttcca gctgtggcaa tttggggagt480
gggtggacgt ggtcgtggat gacctgctgc ccatcaagga cgggaagcta gtgttcgtgc540
actctgccga aggcaacgag ttctggagcg ccctgcttga gaaggcctat gccaaggtaa600
atggcagcta cgaggccctg tcagggggca gcacctcaga gggctttgag gacttcacag660
gcggggttac cgagtggtac gagttgcgca aggctcccag tgacctctac cagatcatcc720
tcaaggcgct ggagcggggc tccctgctgg gctgctccat agacatctcc agcgttctag780
acatggaggc catcactttc aagaagttgg tgaagggcca tgcctactct gtgaccgggg840
ccaagcaggt gaactaccga ggccaggtgg tgagcctgat ccggatgcgg aacccctggg900
gcgaggtgga gtggacggga gcctggagcg acagctcctc agagtggaac aacgtggacc960
catatgaacg ggaccagctc cgggtcaaga tggaggacgg ggagttctgg atgtcattcc1020
gagacttcat gcgggagttc acccgcctgg agatctgcaa cctcacaccc gacgccctca1080
agagccggac catccgcaaa tggaacacca cactctacga aggcacctgg cggcggggga1140
gcaccgcggg gggctgccga aactacccag ccaccttctg ggtgaaccct cagttcaaga1200
tccggctgga tgagacggat gacccggacg actacgggga ccgcgagtca ggctgcagct1260
tcgtgctcgc ccttatgcag aagcaccgtc gccgcgagcg ccgcttcggc cgcgacatgg1320
agactattgg cttcgcggtc tacgaggtcc ctccggagct ggtgggccag ccggccgtac1380
acttgaagcg tgacttcttc ctggccaatg cgtctcgggc gcgctcagag cagttcatca1440
acctgcgaga ggtcagcacc cgcttccgcc tgccacccgg ggagtatgtg gtggtgccct1500
ccaccttcga gcccaacaag gagggcgact tcgtgctgcg cttcttctca gagaagagtg1560
ctgggactgt ggagctggat gaccagatcc aggccaatct ccccgatgag caagtgctct1620
cagaagagga gattgacgag aacttcaagg ccctcttcag gcagctggca ggggaggaca1680
tggagatcag cgtgaaggag ttgcggacaa tcctcaatag gatcatcagc aaacacaaag1740
acctgcggac caagggcttc agcctagagt cgtgccgcag catggtgaac ctcatggatc1800
gtgatggcaa tgggaagctg ggcctggtgg agttcaacat cctgtggaac cgcatccgga1860
attacctgtc catcttccgg aagtttgacc tggacaagtc gggcagcatg agtgcctacg1920
agatgcggat ggccattgag tcggcaggct tcaagctcaa caagaagctg tacgagctca1980
tcatcacccg ctactcggag cccgacctgg cggtcgactt tgacaatttc gtttgctgcc2040
tggtgcggct agagaccatg ttccgatttt tcaaaactct ggacacagat ctggatggag2100
ttgtgacctt tgacttgttt aagtggttgc agctgaccat gtttgcatga gg2152
<210>22
<211>714
<212>PRT
<213>人类
<400>22
Met Ser Glu Glu Ile Ile Thr Pro Val Tyr Cys Thr Gly Val Ser Ala
1 5 10 15
Gln Val Gln Lys Gln Arg Ala Arg Glu Leu Gly Leu Gly Arg His Glu
20 25 30
Asn Ala Ile Lys Tyr Leu Gly Gln Asp Tyr Glu Gln Leu Arg Val Arg
35 40 45
Cys Leu Gln Ser Gly Thr Leu Phe Arg Asp Glu Ala Phe Pro Pro Val
50 55 60
Pro Gln Ser Leu Gly Tyr Lys Asp Leu Gly Pro Asn Ser Ser Lys Thr
65 70 75 80
Tyr Gly Ile Lys Trp Lys Arg Pro Thr Glu Leu Leu Ser Asn Pro Gln
85 90 95
Phe Ile Val Asp Gly Ala Thr Arg Thr Asp Ile Cys Gln Gly Ala Leu
100 105 110
Gly Asp Cys Trp Leu Leu Ala Ala Ile Ala Ser Leu Thr Leu Asn Asp
115 120 125
Thr Leu Leu His Arg Val Val Pro His Gly Gln Ser Phe Gln Asn Gly
130 135 140
Tyr Ala Gly Ile Phe His Phe Gln Leu Trp Gln Phe Gly Glu Trp Val
145 150 155 160
Asp Val Val Val Asp Asp Leu Leu Pro Ile Lys Asp Gly Lys Leu Val
165 170 175
Phe Val His Ser Ala Glu Gly Asn Glu Phe Trp Ser Ala Leu Leu Glu
180 185 190
Lys Ala Tyr Ala Lys Val Asn Gly Ser Tyr Glu Ala Leu Ser Gly Gly
195 200 205
Ser Thr Ser Glu Gly Phe Glu Asp Phe Thr Gly Gly Val Thr Glu Trp
210 215 220
Tyr Glu Leu Arg Lys Ala Pro Ser Asp Leu Tyr Gln Ile Ile Leu Lys
225 230 235 240
Ala Leu Glu Arg Gly Ser Leu Leu Gly Cys Ser Ile Asp Ile Ser Ser
245 250 255
Val Leu Asp Met Glu Ala Ile Thr Phe Lys Lys Leu Val Lys Gly His
260 265 270
Ala Tyr Ser Val Thr Gly Ala Lys Gln Val Asn Tyr Arg Gly Gln Val
275 280 285
Val Ser Leu Ile Arg Met Arg Asn Pro Trp Gly Glu Val Glu Trp Thr
290 295 300
Gly Ala Trp Ser Asp Ser Ser Ser Glu Trp Asn Asn Val Asp Pro Tyr
305 310 315 320
Glu Arg Asp Gln Leu Arg Val Lys Met Glu Asp Gly Glu Phe Trp Met
325 330 335
Ser Phe Arg Asp Phe Met Arg Glu Phe Thr Arg Leu Glu Ile Cys Asn
340 345 350
Leu Thr Pro Asp Ala Leu Lys Ser Arg Thr Ile Arg Lys Trp Asn Thr
355 360 365
Thr Leu Tyr Glu Gly Thr Trp Arg Arg Gly Ser Thr Ala Gly Gly Cys
370 375 380
Arg Asn Tyr Pro Ala Thr Phe Trp Val Asn Pro Gln Phe Lys Ile Arg
385 390 395 400
Leu Asp Glu Thr Asp Asp Pro Asp Asp Tyr Gly Asp Arg Glu Ser Gly
405 410 415
Cys Ser Phe Val Leu Ala Leu Met Gln Lys His Arg Arg Arg Glu Arg
420 425 430
Arg Phe Gly Arg Asp Met Glu Thr Ile Gly Phe Ala Val Tyr Glu Val
435 440 445
Pro Pro Glu Leu Val Gly Gln Pro Ala Val His Leu Lys Arg Asp Phe
450 455 460
Phe Leu Ala Asn Ala Ser Arg Ala Arg Ser Glu Gln Phe Ile Asn Leu
465 470 475 480
Arg Glu Val Ser Thr Arg Phe Arg Leu Pro Pro Gly Glu Tyr Val Val
485 490 495
Val Pro Ser Thr Phe Glu Pro Asn Lys Glu Gly Asp Phe Val Leu Arg
500 505 510
Phe Phe Ser Glu Lys Ser Ala Gly Thr Val Glu Leu Asp Asp Gln Ile
515 520 525
Gln Ala Asn Leu Pro Asp Glu Gln Val Leu Ser Glu Glu Glu Ile Asp
530 535 540
Glu Asn Phe Lys Ala Leu Phe Arg Gln Leu Ala Gly Glu Asp Met Glu
545 550 555 560
Ile Ser Val Lys Glu Leu Arg Thr Ile Leu Asn Arg Ile Ile Ser Lys
565 570 575
His Lys Asp Leu Arg Thr Lys Gly Phe Ser Leu Glu Ser Cys Arg Ser
580 585 590
Met Val Asn Leu Met Asp Arg Asp Gly Asn Gly Lys Leu Gly Leu Val
595 600 605
Glu Phe Asn Ile Leu Trp Asn Arg Ile Arg Asn Tyr Leu Ser Ile Phe
610 615 620
Arg Lys Phe Asp Leu Asp Lys Ser Gly Ser Met Ser Ala Tyr Glu Met
625 630 635 640
Arg Met Ala Ile Glu Ser Ala Gly Phe Lys Leu Asn Lys Lys Leu Tyr
645 650 655
Glu Leu Ile Ile Thr Arg Tyr Ser Glu Pro Asp Leu Ala Val Asp Phe
660 665 670
Asp Asn Phe Val Cys Cys Leu Val Arg Leu Glu Thr Met Phe Arg Phe
675 680 685
Phe Lys Thr Leu Asp Thr Asp Leu Asp Gly Val Val Thr Phe Asp Leu
690 695 700
Phe Lys Trp Leu Gln Leu Thr Met Phe Ala
705 710
<210>23
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG30的锚定引物
<400>23
aagctttttt tttttc 16
<210>24
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG30的H-AP33引物
<400>24
aagcttgctg ctc13
<210>25
<211>2246
<212>DNA
<213>人类
<400>25
cctcaggttt gccaatagga ttatcctgct gccatcatgt cttggtttgt tgatcttgct60
ggaaaggcag aagatctttt aaaccgagtt gatcaagggg ctgcaacagc tctcagtagg120
aaagacaatg ccagcaacat atatagcaaa aatactgact atactgaact tcaccagcaa180
aatacagatt tgatatatca gactggacct aaatctacgt atatttcatc agcagctgat240
aacattcgaa atcaaaaagc caccatctta gctggcactg caaatgtgaa agtaggatct300
cggacaccag tagaggcctc tcatcctgtt gaaaatgcat ctgttcctag gccttcatcc360
cattttgtgc gaagaaaaaa gtcagaacct gatgatgagc tgctgtttga ttttcttaat420
agttcacaga aggagcctac cgggagggtg gaaatcagaa aggaaaaagg caagacacct480
gtctttcaga gctctcagac atcaagtgtc agttctgtga accccagtgt aaccaccatc540
aaaaccattg aagaaaattc ttttgggagc caaacccacg aagctgccag taactcagat600
tctagccatg aaggtcaaga ggaatcttca aaggaaaatg tgtcatcaaa tgctgcctgc660
cctgaccaca ccccaacacc taatgatgat ggcaaatcac atgaactgtc taaccttcga720
ctggagaatc agctgctgag gaatgaagtt cagtctttaa atcaagaaat ggcctcgtta780
ctccaaagat ccaaagagac tcaagaagaa ttaaacaaag caagagcaag agttgaaaag840
tggaatgctg accattcaaa gagtgatcga atgactcgag gactccgagc ccaagtagat900
gacctgactg aagctgtggc tgcaaaggat tcccagctgg ctgtactgaa agtgagactc960
caggaagctg accagctact gagtactcgc acagaagcat tagaagcctt acagagtgaa1020
aaatcacgaa taatgcagga tcaaagtgaa ggtaacagcc tgcagaatca agctctgcag1080
actcttcagg agagactgca tgaagcggat gccactctga agagagagca ggagagctat1140
aaacagatgc agagcgagtt tgctgcacgc cttaataaag tggaaatgga acgtcagaat1200
ttagcagaag caattacact ggccgaaaga aaatactcag atgagaagaa gagggttgat1260
gaactgcagc agcaagtcaa gctgtataag ttgaacttgg agtcctctaa gcaggaatta1320
attgactaca agcaaaaagc tactagaata ctgcaatcta aggaaaaatt gattaacagc1380
ttgaaagaag gctctggttt tgaaggccta gatagcagca ctgccagtag catggagctg1440
gaagaacttc ggcatgagaa agagatgcag agggaggaaa tacagaagct gatgggccag1500
atacatcagc tcagatccga attacaggat atggaggcac agcaagttaa tgaagcagaa1560
tcagcaagag aacagttaca ggatctgcat gaccaaatag ctgggcagaa agcatccaaa1620
caagaactag agacagaact ggagcgactg aagcaggagt tccactatat agaagaagat1680
ctttatcgaa caaagaacac attgcaaagc agaattaaag atcgagacga agaaattcaa1740
aaactcagga atcagcttac caataaaact ttaagcaata gcagtcagtc tgagttagaa1800
aatcgactcc atcagctaac agagactctc atccagaaac agaccatgct ggagagtctc1860
agcacagaaa agaactccct ggtctttcaa ctggagcgcc tcgaacagca gatgaactcc1920
gcctctggaa gtagtagtaa tgggtcttcg attaatatgt ctggaattga caatggtgaa1980
ggcactcgtc tgcgaaatgt tcctgttctt tttaatgaca cagaaactaa tctggcagga2040
atgtacggaa aagttcgcaa agctgctagt tcaattgatc agtttagtat tcgcctggga2100
atttttctcc gaagataccc catagcgcga gtttttgtaa ttatatatat ggctttgctt2160
cacctctggg tcatgattgt tctgttgact tacacaccag aaatgcacca cgaccaacca2220
tatggcaaat gaaccaagcc cagttg 2246
<210>26
<211>731
<212>PRT
<213>人类
<400>26
Met Ser Trp Phe Val Asp Leu Ala Gly Lys Ala Glu Asp Leu Leu Asn
1 5 10 15
Arg Val Asp Gln Gly Ala Ala Thr Ala Leu Ser Arg Lys Asp Asn Ala
20 25 30
Ser Asn Ile Tyr Ser Lys Asn Thr Asp Tyr Thr Glu Leu His Gln Gln
35 40 45
Asn Thr Asp Leu Ile Tyr Gln Thr Gly Pro Lys Ser Thr Tyr Ile Ser
50 55 60
Ser Ala Ala Asp Asn Ile Arg Asn Gln Lys Ala Thr Ile Leu Ala Gly
65 70 75 80
Thr Ala Asn Val Lys Val Gly Ser Arg Thr Pro Val Glu Ala Ser His
85 90 95
Pro Val Glu Asn Ala Ser Val Pro Arg Pro Ser Ser His Phe Val Arg
100 105 110
Arg Lys Lys Ser Glu Pro Asp Asp Glu Leu Leu Phe Asp Phe Leu Asn
115 120 125
Ser Ser Gln Lys Glu Pro Thr Gly Arg Val Glu Ile Arg Lys Glu Lys
130 135 140
Gly Lys Thr Pro Val Phe Gln Ser Ser Gln Thr Ser Ser Val Ser Ser
145 150 155 160
Val Asn Pro Ser Val Thr Thr Ile Lys Thr Ile Glu Glu Asn Ser Phe
165 170 175
Gly Ser Gln Thr His Glu Ala Ala Ser Asn Ser Asp Ser Ser His Glu
180 185 190
Gly Gln Glu Glu Ser Ser Lys Glu Asn Val Ser Ser Asn Ala Ala Cys
195 200 205
Pro Asp His Thr Pro Thr Pro Asn Asp Asp Gly Lys Ser His Glu Leu
210 215 220
Ser Asn Leu Arg Leu Glu Asn Gln Leu Leu Arg Asn Glu Val Gln Ser
225 230 235 240
Leu Asn Gln Glu Met Ala Ser Leu Leu Gln Arg Ser Lys Glu Thr Gln
245 250 255
Glu Glu Leu Asn Lys Ala Arg Ala Arg Val Glu Lys Trp Asn Ala Asp
260 265 270
His Ser Lys Ser Asp Arg Met Thr Arg Gly Leu Arg Ala Gln Val Asp
275 280 285
Asp Leu Thr Glu Ala Val Ala Ala Lys Asp Ser Gln Leu Ala Val Leu
290 295 300
Lys Val Arg Leu Gln Glu Ala Asp Gln Leu Leu Ser Thr Arg Thr Glu
305 310 315 320
Ala Leu Glu Ala Leu Gln Ser Glu Lys Ser Arg Ile Met Gln Asp Gln
325 330 335
Ser Glu Gly Asn Ser Leu Gln Asn Gln Ala Leu Gln Thr Leu Gln Glu
340 345 350
Arg Leu His Glu Ala Asp Ala Thr Leu Lys Arg Glu Gln Glu Ser Tyr
355 360 365
Lys Gln Met Gln Ser Glu Phe Ala Ala Arg Leu Asn Lys Val Glu Met
370 375 380
Glu Arg Gln Asn Leu Ala Glu Ala Ile Thr Leu Ala Glu Arg Lys Tyr
385 390 395 400
Ser Asp Glu Lys Lys Arg Val Asp Glu Leu Gln Gln Gln Val Lys Leu
405 410 415
Tyr Lys Leu Asn Leu Glu Ser Ser Lys Gln Glu Leu Ile Asp Tyr Lys
420 425 430
Gln Lys Ala Thr Arg Ile Leu Gln Ser Lys Glu Lys Leu Ile Asn Ser
435 440 445
Leu Lys Glu Gly Ser Gly Phe Glu Gly Leu Asp Ser Ser Thr Ala Ser
450 455 460
Ser Met Glu Leu Glu Glu Leu Arg His Glu Lys Glu Met Gln Arg Glu
465 470 475 480
Glu Ile Gln Lys Leu Met Gly Gln Ile His Gln Leu Arg Ser Glu Leu
485 490 495
Gln Asp Met Glu Ala Gln Gln Val Asn Glu Ala Glu Ser Ala Arg Glu
500 505 510
Gln Leu Gln Asp Leu His Asp Gln Ile Ala Gly Gln Lys Ala Ser Lys
515 520 525
Gln Glu Leu Glu Thr Glu Leu Glu Arg Leu Lys Gln Glu Phe His Tyr
530 535 540
Ile Glu Glu Asp Leu Tyr Arg Thr Lys Asn Thr Leu Gln Ser Arg Ile
545 550 555 560
Lys Asp Arg Asp Glu Glu Ile Gln Lys Leu Arg Asn Gln Leu Thr Asn
565 570 575
Lys Thr Leu Ser Asn Ser Ser Gln Ser Glu Leu Glu Asn Arg Leu His
580 585 590
Gln Leu Thr Glu Thr Leu Ile Gln Lys Gln Thr Met Leu Glu Ser Leu
595 600 605
Ser Thr Glu Lys Asn Ser Leu Val Phe Gln Leu Glu Arg Leu Glu Gln
610 615 620
Gln Met Asn Ser Ala Ser Gly Ser Ser Ser Asn Gly Ser Ser Ile Asn
625 630 635 640
Met Ser Gly Ile Asp Asn Gly Glu Gly Thr Arg Leu Arg Asn Val Pro
645 650 655
Val Leu Phe Asn Asp Thr Glu Thr Asn Leu Ala Gly Met Tyr Gly Lys
660 665 670
Val Arg Lys Ala Ala Ser Ser Ile Asp Gln Phe Ser Ile Arg Leu Gly
675 680 685
Ile Phe Leu Arg Arg Tyr Pro Ile Ala Arg Val Phe Val Ile Ile Tyr
690 695 700
Met Ala Leu Leu His Leu Trp Val Met Ile Val Leu Leu Thr Tyr Thr
705 710 715 720
Pro Glu Met His His Asp Gln Pro Tyr Gly Lys
725 730
<210>27
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG31的锚定引物
<400>27
aagctttttt tttttg16
<210>28
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG31的H-AP34引物
<400>28
aagcttcagc agc 13
<210>29
<211>1973
<212>DNA
<213>人类
<400>29
gcccctctgg acactcataa ttcaatggta gatgcaggtg gagttgagaa catcacccag60
cttccccagg agcttcctca gatgatggct gcagcagccg atggtttggg gagtatagcg120
atagacacga cccagctcaa catgtccgtg acagatccca cagcctgggc tacagccatg180
aataacctgg gcatggttcc cgtagggtcg cctggacagc agctcgtgtc tgactcaatc240
tgtgtcccag gctttgatcc aagcctcaac atgatgactg gaatcacccc cattaaccca300
atgataccag gccttggact ggtacctccc ccaccaccaa cagaagtggc tgttgtcaaa360
gaaataatcc actgcaaaag ctgtactctt tttcctcaaa atccaaatct tccacctcct420
tccacaagag aacgacctcc tgggtgtaag accgtgtttg tcggaggatt accagaaaat480
gctactgagg aaattattca agaagtcttt gaacagtgcg gtgatattac agcaattcgg540
aaaagcaaga agaatttttg tcacattcgc tttgcagagg aattcatggt tgataaagcc600
atttaccttt ctggttatag gatgcgatta gggtctagca ccgacaaaaa ggattcaggc660
cgccttcatg tggactttgc ccaggccagg gatgacttct atgagtggga atgcaagcag720
aggatgcgtg cccgggagga gcggcaccgg cgcaagctgg aggaggaccg gctcaggccc780
ccatccccgc ctgccataat gcactactcg gagcacgaag ccgctctgct ggctgaaaag840
ctgaaagatg atagcaagtc ttcagaggct atcacagtgc tgctttcctg gattgaacga900
ggggaagtga atcggcgctc tgcaaaccag ttctattcca tggtgcagtc ggccaacagc960
cacgtccgcc ggctaatgaa tgaaaaagcc acccatgagc aagagatgga ggaagccaag1020
gagaatttta aaaatgcctt aactgggatt ctcactcaat ttgagcagat tgtggccgtt1080
ttcaacgctt ctaccagaca aaaagcttgg gaccatttct cgaaagccca gcgcaagaac1140
atagacattt ggcgaaagca ttctgaggag ctccggaatg ctcaaagtga gcagctcatg1200
ggcatccgcc gcgaagaaga aatggaaatg tctgatgatg agaactgtga cagccctaca1260
aagaaaatga gagtcgatga atcagccctg gctgcccagg cctacgctct gaaagaggag1320
aatgacagtc tccgctggca gctggatgcc tacaggaatg aggtggagct gctgaaacaa1380
gaaaaagaac agcttttccg aacagaagaa aacctcacca aggaccagca actgcagttt1440
ctgcagcaaa ccatgcaagg catgcagcag caattgctaa ccatccagga ggagttaaac1500
aacaaaaagt cagaattgga acaagcaaag gaagagcagt cccatacaca agcgttacta1560
aaagtcctgc aggaacaatt aaaaggtacc aaggaattgg tcgagaccaa tggccacagc1620
catgaggatt caaatgaaat caatgtgttg acagttgcat tagtcaacca agaccgagag1680
aacaatattg agaaaagaag ccaaggctta aaatcagaga aagaagctct actaataggt1740
atcatatcaa cgtttcttca cgtccatcct tttggagcca acatagaata tctttggtca1800
tacatgcagc agctggactc caagatatct gcaaatgaaa tagaaatgct tttgatgagg1860
ctgccacgca tgttcaaaca ggaattcacg ggtgtgggag ccacgctgga aaaaagatgg1920
aagctgtgtg cctttgaagg aattaaaact acctaactgc gaagagcaaa gca 1973
<210>30
<211>643
<212>PRT
<213>人类
<400>30
Met Val Asp Ala Gly Gly Val Glu Asn Ile Thr Gln Leu Pro Gln Glu
1 5 10 15
Leu Pro Gln Met Met Ala Ala Ala Ala Asp Gly Leu Gly Ser Ile Ala
20 25 30
Ile Asp Thr Thr Gln Leu Asn Met Ser Val Thr Asp Pro Thr Ala Trp
35 40 45
Ala Thr Ala Met Asn Asn Leu Gly Met Val Pro Val Gly Ser Pro Gly
50 55 60
Gln Gln Leu Val Ser Asp Ser Ile Cys Val Pro Gly Phe Asp Pro Ser
65 70 75 80
Leu Asn Met Met Thr Gly Ile Thr Pro Ile Asn Pro Met Ile Pro Gly
85 90 95
Leu Gly Leu Val Pro Pro Pro Pro Pro Thr Glu Val Ala Val Val Lys
100 105 110
Glu Ile Ile His Cys Lys Ser Cys Thr Leu Phe Pro Gln Asn Pro Asn
115 120 125
Leu Pro Pro Pro Ser Thr Arg Glu Arg Pro Pro Gly Cys Lys Thr Val
130 135 140
Phe Val Gly Gly Leu Pro Glu Asn Ala Thr Glu Glu Ile Ile Gln Glu
145 150 155 160
Val Phe Glu Gln Cys Gly Asp Ile Thr Ala Ile Arg Lys Ser Lys Lys
165 170 175
Asn Phe Cys His Ile Arg Phe Ala Glu Glu Phe Met Val Asp Lys Ala
180 185 190
Ile Tyr Leu Ser Gly Tyr Arg Met Arg Leu Gly Ser Ser Thr Asp Lys
195 200 205
Lys Asp Ser Gly Arg Leu His Val Asp Phe Ala Gln Ala Arg Asp Asp
210 215 220
Phe Tyr Glu Trp Glu Cys Lys Gln Arg Met Arg Ala Arg Glu Glu Arg
225 230 235 240
His Arg Arg Lys Leu Glu Glu Asp Arg Leu Arg Pro Pro Ser Pro Pro
245 250 255
Ala Ile Met His Tyr Ser Glu His Glu Ala Ala Leu Leu Ala Glu Lys
260 265 270
Leu Lys Asp Asp Ser Lys Ser Ser Glu Ala Ile Thr Val Leu Leu Ser
275 280 285
Trp Ile Glu Arg Gly Glu Val Asn Arg Arg Ser Ala Asn Gln Phe Tyr
290 295 300
Ser Met Val Gln Ser Ala Asn Ser His Val Arg Arg Leu Met Asn Glu
305 310 315 320
Lys Ala Thr His Glu Gln Glu Met Glu Glu Ala Lys Glu Asn Phe Lys
325 330 335
Asn Ala Leu Thr Gly Ile Leu Thr Gln Phe Glu Gln Ile Val Ala Val
340 345 350
Phe Asn Ala Ser Thr Arg Gln Lys Ala Trp Asp His Phe Ser Lys Ala
355 360 365
Gln Arg Lys Asn Ile Asp Ile Trp Arg Lys His Ser Glu Glu Leu Arg
370 375 380
Asn Ala Gln Ser Glu Gln Leu Met Gly Ile Arg Arg Glu Glu Glu Met
385 390 395 400
Glu Met Ser Asp Asp Glu Asn Cys Asp Ser Pro Thr Lys Lys Met Arg
405 410 415
Val Asp Glu Ser Ala Leu Ala Ala Gln Ala Tyr Ala Leu Lys Glu Glu
420 425 430
Asn Asp Ser Leu Arg Trp Gln Leu Asp Ala Tyr Arg Asn Glu Val Glu
435 440 445
Leu Leu Lys Gln Glu Lys Glu Gln Leu Phe Arg Thr Glu Glu Asn Leu
450 455 460
Thr Lys Asp Gln Gln Leu Gln Phe Leu Gln Gln Thr Met Gln Gly Met
465 470 475 480
Gln Gln Gln Leu Leu Thr Ile Gln Glu Glu Leu Asn Asn Lys Lys Ser
485 490 495
Glu Leu Glu Gln Ala Lys Glu Glu Gln Ser His Thr Gln Ala Leu Leu
500 505 510
Lys Val Leu Gln Glu Gln Leu Lys Gly Thr Lys Glu Leu Val Glu Thr
515 520 525
Asn Gly His Ser His Glu Asp Ser Asn Glu Ile Asn Val Leu Thr Val
530 535 540
Ala Leu Val Asn Gln Asp Arg Glu Asn Asn Ile Glu Lys Arg Ser Gln
545 550 555 560
Gly Leu Lys Ser Glu Lys Glu Ala Leu Leu Ile Gly Ile Ile Ser Thr
565 570 575
Phe Leu His Val His Pro Phe Gly Ala Asn Ile Glu Tyr Leu Trp Ser
580 585 590
Tyr Met Gln Gln Leu Asp Ser Lys Ile Ser Ala Asn Glu Ile Glu Met
595 600 605
Leu Leu Met Arg Leu Pro Arg Met Phe Lys Gln Glu Phe Thr Gly Val
610 615 620
Gly Ala Thr Leu Glu Lys Arg Trp Lys Leu Cys Ala Phe Glu Gly Ile
625 630 635 640
Lys Thr Thr
<210>31
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG38的锚定引物
<400>31
aagctttttt tttttc16
<210>32
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG38的H-AP10引物
<400>32
aagcttccac gta 13
<210>33
<211>1586
<212>DNA
<213>人类
<400>33
ggagggtggt gtccactgcc cagttccgtg tcccgatgcc cagcgccagc gccagccgca60
agagtcagga gaagccgcgg gagatcatgg acgcggcgga agattatgct aaagagagat120
atggaatatc ttcaatgata caatcacaag aaaaaccaga tcgagttttg gttcgggtta180
gagacttgac aatacaaaaa gctgatgaag ttgtttgggt acgtgcaaga gttcatacaa240
gcagagctaa agggaaacag tgcttcttag tcctacgtca gcagcagttt aatgtccagg300
ctcttgtggc ggtgggagac catgcaagca agcagatggt taaatttgct gccaacatca360
acaaagagag cattgtggat gtagaaggtg ttgtgagaaa agtgaatcag aaaattggaa420
gctgtacaca gcaagacgtt gagttacatg ttcagaagat ttatgtgatc agtttggctg480
aaccccgtct gcccctgcag ctggatgatg ctgttcggcc tgaggcagaa ggagaagagg540
aaggaagagc tactgttaac caggatacaa gattagacaa cagagtcatt gatcttagga600
catcaactag tcaggcagtc ttccgtctcc agtctggcat ctgccatctc ttccgagaaa660
ctttaattaa caaaggtttt gtggaaatcc aaactcctaa aattatttca gctgccagtg720
aaggaggagc caatgttttt actgtgtcat attttaaaaa taatgcatac ctggctcagt780
ccccacagct atataagcaa atgtgcattt gtgctgattt tgagaaggtt ttctctattg840
gaccagtatt cagagcggaa gactctaata cccatagaca tctaactgag tttgttggtt900
tggacattga aatggctttt aattaccatt accacgaagt tatggaagaa attgctgaca960
ccatggtaca catattcaaa ggacttcaag aaaggtttca gactgaaatt caaacagtga1020
ataaacagtt cccatgtgag ccattcaaat ttttggagcc aactctaaga ctagaatatt1080
gtgaagcatt ggctatgctt agggaagctg gagtcgaaat gggagatgaa gacgatctga1140
gcacaccaaa tgaaaagctg ttgggtcatt tggtaaagga aaagtatgat acagattttt1200
atattcttga taaatatcca ttggctgtaa gacctttcta taccatgcct gacccaagaa1260
atcccaaaca gtccaactct tacgatatgt tcatgagagg agaagaaata ttgtcaggag1320
ctcaaagaat acatgatcct caactgctaa cagagagagc tttacatcat ggaattgatt1380
tggagaaaat taaggcttac attgattcct tccgctttgg agcccctcct catgctggtg1440
gaggcattgg attggaacga gttactatgc tgtttctggg attgcataat gttcgtcaga1500
cctccatgtt ccctcgtgat cccaaacgac tcactcctta aattcacact ttgccactta1560
actccagtgt ggatgacaga gcgaga 1586
<210>34
<211>501
<212>PRT
<213>人类
<400>34
Met Pro Ser Ala Ser Ala Ser Arg Lys Ser Gln Glu Lys Pro Arg Glu
1 5 10 15
Ile Met Asp Ala Ala Glu Asp Tyr Ala Lys Glu Arg Tyr Gly Ile Ser
20 25 30
Ser Met Ile Gln Ser Gln Glu Lys Pro Asp Arg Val Leu Val Arg Val
35 40 45
Arg Asp Leu Thr Ile Gln Lys Ala Asp Glu Val Val Trp Val Arg Ala
50 55 60
Arg Val His Thr Ser Arg Ala Lys Gly Lys Gln Cys Phe Leu Val Leu
65 70 75 80
Arg Gln Gln Gln Phe Asn Val Gln Ala Leu Val Ala Val Gly Asp His
85 90 95
Ala Ser Lys Gln Met Val Lys Phe Ala Ala Asn Ile Asn Lys Glu Ser
100 105 110
Ile Val Asp Val Glu Gly Val Val Arg Lys Val Asn Gln Lys Ile Gly
120 120 125
Ser Cys Thr Gln Gln Asp Val Glu Leu His Val Gln Lys Ile Tyr Val
130 135 140
Ile Ser Leu Ala Glu Pro Arg Leu Pro Leu Gln Leu Asp Asp Ala Val
145 150 155 160
Arg Pro Glu Ala Glu Gly Glu Glu Glu Gly Arg Ala Thr Val Asn Gln
165 170 175
Asp Thr Arg Leu Asp Asn Arg Val Ile Asp Leu Arg Thr Ser Thr Ser
180 185 190
Gln Ala Val Phe Arg Leu Gln Ser Gly Ile Cys His Leu Phe Arg Glu
195 200 205
Thr Leu Ile Asn Lys Gly Phe Val Glu Ile Gln Thr Pro Lys Ile Ile
210 215 220
Ser Ala Ala Ser Glu Gly Gly Ala Asn Val Phe Thr Val Ser Tyr Phe
225 230 235 240
Lys Asn Asn Ala Tyr Leu Ala Gln Ser Pro Gln Leu Tyr Lys Gln Met
245 250 255
Cys Ile Cys Ala Asp Phe Glu Lys Val Phe Ser Ile Gly Pro Val Phe
260 265 270
Arg Ala Glu Asp Ser Asn Thr His Arg His Leu Thr Glu Phe Val Gly
275 280 285
Leu Asp Ile Glu Met Ala Phe Asn Tyr His Tyr His Glu Val Met Glu
290 295 300
Glu Ile Ala Asp Thr Met Val His Ile Phe Lys Gly Leu Gln Glu Arg
305 310 315 320
Phe Gln Thr Glu Ile Gln Thr Val Asn Lys Gln Phe Pro Cys Glu Pro
325 330 335
Phe Lys Phe Leu Glu Pro Thr Leu Arg Leu Glu Tyr Cys Glu Ala Leu
340 345 350
Ala Met Leu Arg Glu Ala Gly Val Glu Met Gly Asp Glu Asp Asp Leu
355 360 365
Ser Thr Pro Asn Glu Lys Leu Leu Gly His Leu Val Lys Glu Lys Tyr
370 375 380
Asp Thr Asp Phe Tyr Ile Leu Asp Lys Tyr Pro Leu Ala Val Arg Pro
385 390 395 400
Phe Tyr Thr Met Pro Asp Pro Arg Asn Pro Lys Gln Ser Asn Ser Tyr
405 410 415
Asp Met Phe Met Arg Gly Glu Glu Ile Leu Ser Gly Ala Gln Arg Ile
420 425 430
His Asp Pro Gln Leu Leu Thr Glu Arg Ala Leu His His Gly Ile Asp
435 440 445
Leu Glu Lys Ile Lys Ala Tyr Ile Asp Ser Phe Arg Phe Gly Ala Pro
450 455 460
Pro His Ala Gly Gly Gly Ile Gly Leu Glu Arg Val Thr Met Leu Phe
465 470 475 480
Leu Gly Leu His Asn Val Arg Gln Thr Ser Met Phe Pro Arg Asp Pro
485 490 495
Lys Arg Leu Thr Pro
500
<210>35
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG40的锚定引物
<400>35
aagctttttt tttttc 16
<210>36
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG40的H-AP11引物
<400>36
aagcttcggg taa13
<210>37
<211>1245
<212>DNA
<213>人类
<400>37
aagagggcaa ccctaacgat acgcttgact ttctgtggct gggaacacct tccaccatga60
ccacctcagc aagttcccac ttaaataaag gcatcaagca ggtgtacatg tccctgcctc120
agggtgagaa agtccaggcc atgtatatct ggatcgatgg tactggagaa ggactgcgct180
gcaagacccg gaccctggac agtgagccca agtgtgtgga agagttgcct gagtggaatt240
tcgatggctc cagtacttta cagtctgagg gttccaacag tgacatgtat ctcgtgcctg300
ctgccatgtt tcgggacccc ttccgtaagg accctaacaa gctggtgtta tgtgaagttt360
tcaagtacaa tcgaaggcct gcagagacca atttgaggca cacctgtaaa cggataatag420
acatggtgag caaccagcac ccctggtttg gcatggagca ggagtatacc ctcatgggga480
cagatgggca cccctttggt tggccttcca acggcttcca gggccccagg gtccatatta540
ctgtggtgtg ggagcagaca gagcctatgg cagggacatc gtggaggccc attaccgggc600
ctgcttgtat gctggagtca agattgcggg gactaatgcc gaggtcatgc ctgcccagtg660
ggaatttcag attggacctt gtgaaggaat cagcatggga gatcatctct gggtggcccg720
tttcatcttg catcgtgtgt gtgaagactt tggagtgata gcaacctttg atcctaagcc780
cattcctggg aactggaatg gtgcaggctg ccataccaac ttcagcacca aggccatgcg840
ggaggagaat ggtctgaagt acatcgagga ggccattgag aaactaagca agcggcacca900
gtaccacatc cgtgcctatg atcccaaggg aggcctggac aatgcccgac gtctaactgg960
attccatgaa acctccaaca tcaacgactt ttctgctggt gtagccaatc gtagcgccag1020
catacgcatt ccccggactg ttggccagga gaagaagggt tactttgaag atcgtcgccc1080
ctctgccaac tgcgacccct tttcggtgac agaagccctc atccgcacgt gtcttctcaa1140
tgaaaccggc gatgagccct tccagtacaa aaattaagtg gactagacct ccagctgttg1200
agcccctcct agttcttcat cccactccaa ctcttccccc tctca1245
<210>38
<211>233
<212>PRT
<213>人类
<400>38
Met Thr Thr Ser Ala Ser Ser His Leu Asn Lys Gly Ile Lys Gln Val
1 5 10 15
Tyr Met Ser Leu Pro Gln Gly Glu Lys Val Gln Ala Met Tyr Ile Trp
20 25 30
Ile Asp Gly Thr Gly Glu Gly Leu Arg Cys Lys Thr Arg Thr Leu Asp
35 40 45
Ser Glu Pro Lys Cys Val Glu Glu Leu Pro Glu Trp Asn Phe Asp Gly
50 55 60
Ser Ser Thr Leu Gln Ser Glu Gly Ser Asn Ser Asp Met Tyr Leu Val
65 70 75 80
Pro Ala Ala Met Phe Arg Asp Pro Phe Arg Lys Asp Pro Asn Lys Leu
85 90 95
Val Leu Cys Glu Val Phe Lys Tyr Asn Arg Arg Pro Ala Glu Thr Asn
100 105 110
Leu Arg His Thr Cys Lys Arg Ile Ile Asp Met Val Ser Asn Gln His
115 120 125
Pro Trp Phe Gly Met Glu Gln Glu Tyr Thr Leu Met Gly Thr Asp Gly
130 135 140
His Pro Phe Gly Trp Pro Ser Asn Gly Phe Gln Gly Pro Arg Val His
145 150 155 160
Ile Thr Val Val Trp Glu Gln Thr Glu Pro Met Ala Gly Thr Ser Trp
165 170 175
Arg Pro Ile Thr Gly Pro Ala Cys Met Leu Glu Ser Arg Leu Arg Gly
180 185 190
Leu Met Pro Arg Ser Cys Leu Pro Ser Gly Asn Phe Arg Leu Asp Leu
195 200 205
Val Lys Glu Ser Ala Trp Glu Ile Ile Ser Gly Trp Pro Val Ser Ser
210 215 220
Cys Ile Val Cys Val Lys Thr Leu Glu
225 230
<210>39
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG43的锚定引物
<400>39
aagctttttt tttttg 16
<210>40
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG43的H-AP11引物
<400>40
aagcttcggg taa13
<210>41
<211>1721
<212>DNA
<213>人类
<400>41
ggcaaggatc ttgttccaaa tcatctttca tattaccttt ataatcatgt ggctatgtgg60
ccggaacaaa gtgacaaatg gcctacagct gtgagagcaa atggacatct cctcctgaac120
tctgagaaga tgtcaaaatc cacaggcaac ttcctcactt tgacccaagc tattgacaaa180
ttttcagcag atggaatgcg tttggctctg gctgatgctg gtgacactgt agaagatgcc240
aactttgtgg aagccatggc agatgcaggt attctccgtc tgtacacctg ggtagagtgg300
gtgaaagaaa tggttgccaa ctgggacagc ctaagaagtg gtcctgccag cactttcaat360
gatagagttt ttgccagtga attgaatgca ggaattataa aaacagatca aaactatgaa420
aagatgatgt ttaaagaagc tttgaaaaca gggttttttg agtttcaggc cgcaaaagat480
aagtaccgtg aattggctgt ggaagggatg cacagagaac ttgtgttccg gtttattgaa540
gttcagacac ttctcctcgc tccattctgt ccacatttgt gtgagcacat ctggacactc600
ctgggaaagc ctgactcaat tatgaatgct tcatggcctg tggcaggtcc tgttaatgaa660
gttttaatac actcctcaca gtatcttatg gaagtaacac atgaccttag actacgactc720
aagaactata tgatgccagc taaagggaag aagactgaca aacaacccct gcagaagccc780
tcacattgca ccatctatgt ggcaaagaac tatccacctt ggcaacatac caccctgtct840
gttctacgta aacactttga ggccaataac ggaaaactgc ctgacaacaa agtcattgct900
agtgaactag gcagtatgcc agaactgaag aaatacatga agaaagtcat gccatttgtt960
gccatgatta aggaaaatct ggagaagatg gggcctcgta ttctggattt gcaattagaa1020
tttgatgaaa aggctgtgct tatggagaat atagtctatc tgactaattc gcttgagcta1080
gaacacatag aagtcaagtt tgcctccgaa gcagaagata aaatcaggga agactgctgt1140
cctgggaaac cacttaatgt ttttagaata gaacctggtg tgtccgtttc tctggtgaat1200
ccccagccat ccaatggcca cttctcaacc aaaattgaaa tcaggcaagg agataactgt1260
gattccataa tcaggcgttt aatgaaaatg aatcgaggaa ttaaagacct ttccaaagtg1320
aaactgatga gatttgatga tccactgttg gggcctcgac gagttcctgt cctgggaaag1380
gagtacaccg agaagacccc catttctgag catgctgttt tcaatgtgga cctcatgagc1440
aagaaaattc atctgactga gaatgggata agggtggata ttggcgatac aataatctat1500
ctggttcatt aaactcatgc acattggaga tttatcctgg tttcttagga atactactac1560
tctgattgtg tctactgatt ggctatcaga accttaggct ggacctaaat agattgattt1620
catttctaac catccaattc tgcatgtatt cataattcta tcaagtcatc tttgattcct1680
ggacctaata aatttttttt ccctttcttt gggtgtccaa g1721
<210>42
<211>485
<212>PRT
<213>人类
<400>42
Met Trp Pro Glu Gln Ser Asp Lys Trp Pro Thr Ala Val Arg Ala Asn
1 5 10 15
Gly His Leu Leu Leu Asn Ser Glu Lys Met Ser Lys Ser Thr Gly Asn
20 25 30
Phe Leu Thr Leu Thr Gln Ala Ile Asp Lys Phe Ser Ala Asp Gly Met
35 40 45
Arg Leu Ala Leu Ala Asp Ala Gly Asp Thr Val Glu Asp Ala Asn Phe
50 55 60
Val Glu Ala Met Ala Asp Ala Gly Ile Leu Arg Leu Tyr Thr Trp Val
65 70 75 80
Glu Trp Val Lys Glu Met Val Ala Asn Trp Asp Ser Leu Arg Ser Gly
85 90 95
Pro Ala Ser Thr Phe Asn Asp Arg Val Phe Ala Ser Glu Leu Asn Ala
100 105 110
Gly Ile Ile Lys Thr Asp Gln Asn Tyr Glu Lys Met Met Phe Lys Glu
115 120 125
Ala Leu Lys Thr Gly Phe Phe Glu Phe Gln Ala Ala Lys Asp Lys Tyr
130 135 140
Arg Glu Leu Ala Val Glu Gly Met His Arg Glu Leu Val Phe Arg Phe
145 150 155 160
Ile Glu Val Gln Thr Leu Leu Leu Ala Pro Phe Cys Pro His Leu Cys
165 170 175
Glu His Ile Trp Thr Leu Leu Gly Lys Pro Asp Ser Ile Met Asn Ala
180 185 190
Ser Trp Pro Val Ala Gly Pro Val Asn Glu Val Leu Ile His Ser Ser
195 200 205
Gln Tyr Leu Met Glu Val Thr His Asp Leu Arg Leu Arg Leu Lys Asn
210 215 220
Tyr Met Met Pro Ala Lys Gly Lys Lys Thr Asp Lys Gln Pro Leu Gln
225 230 235 240
Lys Pro Ser His Cys Thr Ile Tyr Val Ala Lys Asn Tyr Pro Pro Trp
245 250 255
Gln His Thr Thr Leu Ser Val Leu Arg Lys His Phe Glu Ala Asn Asn
260 265 270
Gly Lys Leu Pro Asp Asn Lys Val Ile Ala Ser Glu Leu Gly Ser Met
275 280 285
Pro Glu Leu Lys Lys Tyr Met Lys Lys Val Met Pro Phe Val Ala Met
290 295 300
Ile Lys Glu Asn Leu Glu Lys Met Gly Pro Arg Ile Leu Asp Leu Gln
305 310 315 320
Leu Glu Phe Asp Glu Lys Ala Val Leu Met Glu Asn Ile Val Tyr Leu
325 330 335
Thr Asn Ser Leu Glu Leu Glu His Ile Glu Val Lys Phe Ala Ser Glu
340 345 350
Ala Glu Asp Lys Ile Arg Glu Asp Cys Cys Pro Gly Lys Pro Leu Asn
355 360 365
Val Phe Arg Ile Glu Pro Gly Val Ser Val Ser Leu Val Asn Pro Gln
370 375 380
Pro Ser Asn Gly His Phe Ser Thr Lys Ile Glu Ile Arg Gln Gly Asp
385 390 395 400
Asn Cys Asp Ser Ile Ile Arg Arg Leu Met Lys Met Asn Arg Gly Ile
405 410 415
Lys Asp Leu Ser Lys Val Lys Leu Met Arg Phe Asp Asp Pro Leu Leu
420 425 430
Gly Pro Arg Arg Val Pro Val Leu Gly Lys Glu Tyr Thr Glu Lys Thr
435 440 445
Pro Ile Ser Glu His Ala Val Phe Asn Val Asp Leu Met Ser Lys Lys
450 455 460
Ile His Leu Thr Glu Asn Gly Ile Arg Val Asp Ile Gly Asp Thr Ile
465 470 475 480
Ile Tyr Leu Val His
485
<210>43
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG44的锚定引物
<400>43
aagctttttt tttttc16
<210>44
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG44的H-AP23引物
<400>44
aagcttggct atg 13
<210>45
<211>1312
<212>DNA
<213>人类
<400>45
cagcatgagc ttcaccactc gctccacctt ctccaccaac taccggtccc tgggctctgt60
ccaggcgccc agctacggcg cccggccggt cagcagcgcg gccagcgtct atgcaggcgc120
tgggggctct ggttcccgga tctccgtgtc ccgctccacc agcttcaggg gcggcatggg180
gtccgggggc ctggccaccg ggatagccgg gggtctggca ggaatgggag gcatccagaa240
cgagaaggag accatgcaaa gcctgaacga ccgcctggcc tcttacctgg acagagtgag300
gagcctggag accgagaacc ggaggctgga gagcaaaatc cgggagcact tggagaagaa360
gggaccccag gtcagagact ggagccatta cttcaagatc atcgaggacc tgagggctca420
gatcttcgca aatactgtgg acaatgcccg catcgttctg cagattgaca atgcccgtct480
tgctgctgat gactttagag tcaagtatga gacagagctg gccatgcgcc agtctgtgga540
gaacgacatc catgggctcc gcaaggtcat tgatgacacc aatatcacac gactgcagct600
ggagacagag atcgaggctc tcaaggagga gctgctcttc atgaagaaga accacgaaga660
ggaagtaaaa ggcctacaag cccagattgc cagctctggg ttgaccgtgg aggtagatgc720
ccccaaatct caggacctcg ccaagatcat ggcagacatc cgggcccaat atgacgagct780
ggctcggaag aaccgagagg agctagacaa gtactggtct cagcagattg aggagagcac840
cacagtggtc accacacagt ctgctgaggt tggagctgct gagacgacgc tcacagagct900
gagacgtaca gtccagtcct tggagatcga cctggactcc atgagaaatc tgaaggccag960
cttggagaac agcctgaggg aggtggaggc ccgctacgcc ctacagatgg agcagctcaa1020
cgggatcctg ctgcaccttg agtcagagct ggcacagacc cgggcagagg gacagcgcca1080
ggcccaggag tatgaggccc tgctgaacat caaggtcaag ctggaggctg agatcgccac1140
ctaccgccgc ctgctggaag atggcgagga ctttaatctt ggtgatgcct tggacagcag1200
caactccatg caaaccatcc aaaagaccac cacccgccgg atagtggatg gcaaagtggt1260
gtctgagacc aatgacacca aagttctgag gcattaagcc agcagaagca gg1312
<210>46
<211>430
<212>PRT
<213>人类
<400>46
Met Ser Phe Thr Thr Arg Ser Thr Phe Ser Thr Asn Tyr Arg Ser Leu
1 5 10 15
Gly Ser Val Gln Ala Pro Ser Tyr Gly Ala Arg Pro Val Ser Ser Ala
20 25 30
Ala Ser Val Tyr Ala Gly Ala Gly Gly Ser Gly Ser Arg Ile Ser Val
35 40 45
Ser Arg Ser Thr Ser Phe Arg Gly Gly Met Gly Ser Gly Gly Leu Ala
50 55 60
Thr Gly Ile Ala Gly Gly Leu Ala Gly Met Gly Gly Ile Gln Asn Glu
65 70 75 80
Lys Glu Thr Met Gln Ser Leu Asn Asp Arg Leu Ala Ser Tyr Leu Asp
85 90 95
Arg Val Arg Ser Leu Glu Thr Glu Asn Arg Arg Leu Glu Ser Lys Ile
100 105 110
Arg Glu His Leu Glu Lys Lys Gly Pro Gln Val Arg Asp Trp Ser His
115 120 125
Tyr Phe Lys Ile Ile Glu Asp Leu Arg Ala Gln Ile Phe Ala Asn Thr
130 135 140
Val Asp Asn Ala Arg Ile Val Leu Gln Ile Asp Asn Ala Arg Leu Ala
145 150 155 160
Ala Asp Asp Phe Arg Val Lys Tyr Glu Thr Glu Leu Ala Met Arg Gln
165 170 175
Ser Val Glu Asn Asp Ile His Gly Leu Arg Lys Val Ile Asp Asp Thr
180 185 190
Asn Ile Thr Arg Leu Gln Leu Glu Thr Glu Ile Glu Ala Leu Lys Glu
195 200 205
Glu Leu Leu Phe Met Lys Lys Asn His Glu Glu Glu Val Lys Gly Leu
210 215 220
Gln Ala Gln Ile Ala Ser Ser Gly Leu Thr Val Glu Val Asp Ala Pro
225 230 235 240
Lys Ser Gln Asp Leu Ala Lys Ile Met Ala Asp Ile Arg Ala Gln Tyr
245 250 255
Asp Glu Leu Ala Arg Lys Asn Arg Glu Glu Leu Asp Lys Tyr Trp Ser
260 265 270
Gln Gln Ile Glu Glu Ser Thr Thr Val Val Thr Thr Gln Ser Ala Glu
275 280 285
Val Gly Ala Ala Glu Thr Thr Leu Thr Glu Leu Arg Arg Thr Val Gln
290 295 300
Ser Leu Glu Ile Asp Leu Asp Ser Met Arg Asn Leu Lys Ala Ser Leu
305 310 315 320
Glu Asn Ser Leu Arg Glu Val Glu Ala Arg Tyr Ala Leu Gln Met Glu
325 330 335
Gln Leu Asn Gly Ile Leu Leu His Leu Glu Ser Glu Leu Ala Gln Thr
340 345 350
Arg Ala Glu Gly Gln Arg Gln Ala Gln Glu Tyr Glu Ala Leu Leu Asn
355 360 365
Ile Lys Val Lys Leu Glu Ala Glu Ile Ala Thr Tyr Arg Arg Leu Leu
370 375 380
Glu Asp Gly Glu Asp Phe Asn Leu Gly Asp Ala Leu Asp Ser Ser Asn
385 390 395 400
Ser Met Gln Thr Ile Gln Lys Thr Thr Thr Arg Arg Ile Val Asp Gly
405 410 415
Lys Val Val Ser Glu Thr Asn Asp Thr Lys Val Leu Arg His
420 425 430
<210>47
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG46的锚定引物
<400>47
aagctttttt ttttta 16
<210>48
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG46的H-AP24引物
<400>48
aagcttcact agc 13
<210>49
<211>827
<212>DNA
<213>人类
<400>49
ttctcctatc ggggtcacag ggacgctaag attgctacct ggactttcgt tgaccatgct60
gtcccgggtg gtactttccg ccgccgccac agcggccccc tctctgaaga atgcagcctt120
cctaggtcca ggggtattgc aggcaacaag gacctttcat acagggcagc cacaccttgt180
ccctgtacca cctcttcctg aatacggagg aaaagttcgt tatggactga tccctgagga240
attcttccag tttctttatc ctaaaactgg tgtaacagga ccctatgtac tcggaactgg300
gcttatcttg tacgctttat ccaaagaaat atatgtgatt agcgcagaga ccttcactgc360
cctatcagta ctaggtgtaa tggtctatgg aattaaaaaa tatggtccct ttgttgcaga420
ctttgctgat aaactcaatg agcaaaaact tgcccaacta gaagaggcga agcaggcttc480
catccaacac atccagaatg caattgatac ggagaagtca caacaggcac tggttcagaa540
gcgccattac ctttttgatg tgcaaaggaa taacattgct atggctttgg aagttactta600
ccgggaacga ctgtatagag tatataagga agtaaagaat cgcctggact atcatatatc660
tgtgcagaac atgatgcgtc gaaaggaaca agaacacatg ataaattggg tggagaagca720
cgtggtgcaa agcatctcca cacagcagga aaaggagaca attgccaagt gcattgcgga780
cctaaagctg ctggcaaaga aggctcaagc acagccagtt atgtaaa 827
<210>50
<211>256
<212>PRT
<213>人类
<400>50
Met Leu Ser Arg Val Val Leu Ser Ala Ala Ala Thr Ala Ala Pro Ser
1 5 10 15
Leu Lys Asn Ala Ala Phe Leu Gly Pro Gly Val Leu Gln Ala Thr Arg
20 25 30
Thr Phe His Thr Gly Gln Pro His Leu Val Pro Val Pro Pro Leu Pro
35 40 45
Glu Tyr Gly Gly Lys Val Arg Tyr Gly Leu Ile Pro Glu Glu Phe Phe
50 55 60
Gln Phe Leu Tyr Pro Lys Thr Gly Val Thr Gly Pro Tyr Val Leu Gly
65 70 75 80
Thr Gly Leu Ile Leu Tyr Ala Leu Ser Lys Glu Ile Tyr Val Ile Ser
85 90 95
Ala Glu Thr Phe Thr Ala Leu Ser Val Leu Gly Val Met Val Tyr Gly
100 105 110
Ile Lys Lys Tyr Gly Pro Phe Val Ala Asp Phe Ala Asp Lys Leu Asn
115 120 125
Glu Gln Lys Leu Ala Gln Leu Glu Glu Ala Lys Gln Ala Ser Ile Gln
130 135 140
His Ile Gln Asn Ala Ile Asp Thr Glu Lys Ser Gln Gln Ala Leu Val
145 150 155 160
Gln Lys Arg His Tyr Leu Phe Asp Val Gln Arg Asn Asn Ile Ala Met
165 170 175
Ala Leu Glu Val Thr Tyr Arg Glu Arg Leu Tyr Arg Val Tyr Lys Glu
180 185 190
Val Lys Asn Arg Leu Asp Tyr His Ile Ser Val Gln Asn Met Met Arg
195 200 205
Arg Lys Glu Gln Glu His Met Ile Asn Trp Val Glu Lys His Val Val
210 215 220
Gln Ser Ile Ser Thr Gln Gln Glu Lys Glu Thr Ile Ala Lys Cys Ile
225 230 235 240
Ala Asp Leu Lys Leu Leu Ala Lys Lys Ala Gln Ala Gln Pro Val Met
245 250 255
<210>51
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG47的锚定引物
<400>51
aagctttttt tttttc 16
<210>52
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG47的H-AP5引物
<400>52
aagcttagta ggc13
<210>53
<211>1707
<212>DNA
<213>人类
<400>53
cagaaggttc tgccggttcc cccagctctg ggtacccggc tctgcatcgc gtcgccatga60
tgggccatcg tccagtgctc gtgctcagcc agaacacaaa gcgtgaatcc ggaagaaaag120
ttcaatctgg aaacatcaat gctgccaaga ctattgcaga tatcatccga acatgtttgg180
gacccaagtc catgatgaag atgcttttgg acccaatggg aggcaatgtg atgaccaatg240
atggcaatgc cattcttcga gagattcaag tccagcatcc agcggccaag tccatgatcg300
aaattagccg gacccaggat gaagaggttg gagatgggac cacatcagta attattcttg360
caggggaaat gctgtctgta gctgagcact tcctggagca gcagatgcac ccaacagtgg420
tgatcagtgc ttaccgcaag gcattggatg atatgatcag caccctaaag aaaataagta480
tcccagtcga catcagtgac agtgatatga tgctgaacat catcaacagc tctattacta540
ccaaagccat cagtcggtgg tcatctttgg cttgcaacat tgccctggat gctgtcaaga600
tggtacagtt tgaggagaat ggtcggaaag agattgacat aaaaaaatat gcaagagtgg660
aaaagatacc tggaggcatc attgaagact cctgtgtctt gcgtggagtc atgattaaca720
aggacgtgac ccatccacgt atgtggcgct atatcaagaa ccctcgcatt gtgctgctgg780
attcttctct ggagtacaag aaaggagaaa gccagactga cattgagatt acacgagagg840
aggacttcac ccgaattctc cagatggagg aagagtacat ccagcagctc tgtgaggaca900
ttatccaact gaagcccgat gtggtcatca ctgaaaaggg catctcagat ttagctcagc960
actaccttat gcgggccaat atcacagcca tccgcagagt ccggaagaca gacaataatc1020
gcattgctag agcctgtggg gcccggatag tcagccgacc agaggaactg agagaagatg1080
atattggaac aggagcaggc ctgttggaaa tcaagaaaat tggagatgaa tactttactt1140
tcatcactga ctgcaaagac cccaaggcct gcaccattct cctccggggg gctagcaaag1200
agattctctc ggaagtagaa cgcaacctcc aggatgccat gcaagtgtgt cgcaatgttc1260
tcctggaccc tcagctggtg ccagggggtg gggcctccga gatggctgtg gcccatgcct1320
tgacagaaaa atccaaggcc atgactggtg tggaacaatg gccatacagg gctgttgccc1380
aggccctaga ggtcattcct cgtaccctga tccagaactg tggggccagc accatccgtc1440
tacttacctc ccttcgggcc aagcacaccc aggagaactg tgagacctgg ggtgtaaatg1500
gtgagacggg tactttggtg gacatgaagg aactgggcat atgggagcca ttggctgtga1560
agctgcagac ttataagaca gcagtggaga cggcagttct gctactgcga attgatgaca1620
tcgtttcagg ccacaaaaag aaaggcgatg accagagccg gcaaggcggg gctcctgatg1680
ctggccagga gtgagtgcta ggcaagg1707
<210>54
<211>545
<212>PRT
<213>人类
<400>54
Met Met Gly His Arg Pro Val Leu Val Leu Ser Gln Asn Thr Lys Arg
1 5 10 15
Glu Ser Gly Arg Lys Val Gln Ser Gly Asn Ile Asn Ala Ala Lys Thr
20 25 30
Ile Ala Asp Ile Ile Arg Thr Cys Leu Gly Pro Lys Ser Met Met Lys
35 40 45
Met Leu Leu Asp Pro Met Gly Gly Asn Val Met Thr Asn Asp Gly Asn
50 55 60
Ala Ile Leu Arg Glu Ile Gln Val Gln His Pro Ala Ala Lys Ser Met
65 70 75 80
Ile Glu Ile Ser Arg Thr Gln Asp Glu Glu Val Gly Asp Gly Thr Thr
85 90 95
Ser Val Ile Ile Leu Ala Gly Glu Met Leu Ser Val Ala Glu His Phe
100 105 110
Leu Glu Gln Gln Met His Pro Thr Val Val Ile Ser Ala Tyr Arg Lys
115 120 125
Ala Leu Asp Asp Met Ile Ser Thr Leu Lys Lys Ile Ser Ile Pro Val
130 135 140
Asp Ile Ser Asp Ser Asp Met Met Leu Asn Ile Ile Asn Ser Ser Ile
145 150 155 160
Thr Thr Lys Ala Ile Ser Arg Trp Ser Ser Leu Ala Cys Asn Ile Ala
165 170 175
Leu Asp Ala Val Lys Met Val Gln Phe Glu Glu Asn Gly Arg Lys Glu
180 185 190
Ile Asp Ile Lys Lys Tyr Ala Arg Val Glu Lys Ile Pro Gly Gly Ile
195 200 205
Ile Glu Asp Ser Cys Val Leu Arg Gly Val Met Ile Asn Lys Asp Val
210 215 220
Thr His Pro Arg Met Trp Arg Tyr Ile Lys Asn Pro Arg Ile Val Leu
225 230 235 240
Leu Asp Ser Ser Leu Glu Tyr Lys Lys Gly Glu Ser Gln Thr Asp Ile
245 250 255
Glu Ile Thr Arg Glu Glu Asp Phe Thr Arg Ile Leu Gln Met Glu Glu
260 265 270
Glu Tyr Ile Gln Gln Leu Cys Glu Asp Ile Ile Gln Leu Lys Pro Asp
275 280 285
Val Val Ile Thr Glu Lys Gly Ile Ser Asp Leu Ala Gln His Tyr Leu
290 295 300
Met Arg Ala Asn Ile Thr Ala Ile Arg Arg Val Arg Lys Thr Asp Asn
305 310 315 320
Asn Arg Ile Ala Arg Ala Cys Gly Ala Arg Ile Val Ser Arg Pro Glu
325 330 335
Glu Leu Arg Glu Asp Asp Ile Gly Thr Gly Ala Gly Leu Leu Glu Ile
340 345 350
Lys Lys Ile Gly Asp Glu Tyr Phe Thr Phe Ile Thr Asp Cys Lys Asp
355 360 365
Pro Lys Ala Cys Thr Ile Leu Leu Arg Gly Ala Ser Lys Glu Ile Leu
370 375 380
Ser Glu Val Glu Arg Asn Leu Gln Asp Ala Met Gln Val Cys Arg Asn
385 390 395 400
Val Leu Leu Asp Pro Gln Leu Val Pro Gly Gly Gly Ala Ser Glu Met
405 410 415
Ala Val Ala His Ala Leu Thr Glu Lys Ser Lys Ala Met Thr Gly Val
420 425 430
Glu Gln Trp Pro Tyr Arg Ala Val Ala Gln Ala Leu Glu Val Ile Pro
435 440 445
Arg Thr Leu Ile Gln Asn Cys Gly Ala Ser Thr Ile Arg Leu Leu Thr
450 455 460
Ser Leu Arg Ala Lys His Thr Gln Glu Asn Cys Glu Thr Trp Gly Val
465 470 475 480
Asn Gly Glu Thr Gly Thr Leu Val Asp Met Lys Glu Leu Gly Ile Trp
485 490 495
Glu Pro Leu Ala Val Lys Leu Gln Thr Tyr Lys Thr Ala Val Glu Thr
500 505 510
Ala Val Leu Leu Leu Arg Ile Asp Asp Ile Val Ser Gly His Lys Lys
515 520 525
Lys Gly Asp Asp Gln Ser Arg Gln Gly Gly Ala Pro Asp Ala Gly Gln
530 535 540
Glu
545
<210>55
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG48的锚定引物
<400>55
aagctttttt ttttta 16
<210>56
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG48的H-AP7引物
<400>56
aagcttaacg agg13
<210>57
<211>643
<212>DNA
<213>人类
<400>57
catgcagaga gcttcacgtc tgaagagaga gctgcacatg ttagccacag agccaccccc60
aggcatcaca tgttggcaag ataaagacca aatggatgac ctgcgagctc aaatattagg120
tggagccaac acaccttatg agaaaggtgt ttttaagcta gaagttatca ttcctgagag180
gtacccattt gaacctcctc agatccgatt tctcactcca atttatcatc caaacattga240
ttctgctgga aggatttgtc tggatgttct caaattgcca ccaaaaggtg cttggagacc300
atccctcaac atcgcaactg tgttgacctc tattcagctg ctcatgtcag aacccaaccc360
tgatgacccg ctcatggctg acatatcctc agaatttaaa tataataagc cagccttcct420
caagaatgcc agacagtgga cagagaagca tgcaagacag aaacaaaagg ctgatgagga480
agagatgctt gataatctac cagaggctgg tgactccaga gtacacaact caacacagaa540
aaggaaggcc agtcagctag taggcataga aaagaaattt catcctgatg tttaggggac600
ttgtcctggt tcatcttagt taatgtgttc tttgccaagg tga 643
<210>58
<211>197
<212>PRT
<213>人类
<400>58
Met Gln Arg Ala Ser Arg Leu Lys Arg Glu Leu His Met Leu Ala Thr
1 5 10 15
Glu Pro Pro Pro Gly Ile Thr Cys Trp Gln Asp Lys Asp Gln Met Asp
20 25 30
Asp Leu Arg Ala Gln Ile Leu Gly Gly Ala Asn Thr Pro Tyr Glu Lys
35 40 45
Gly Val Phe Lys Leu Glu Val Ile Ile Pro Glu Arg Tyr Pro Phe Glu
50 55 60
Pro Pro Gln Ile Arg Phe Leu Thr Pro Ile Tyr His Pro Asn Ile Asp
65 70 75 80
Ser Ala Gly Arg Ile Cys Leu Asp Val Leu Lys Leu Pro Pro Lys Gly
85 90 95
Ala Trp Arg Pro Ser Leu Asn Ile Ala Thr Val Leu Thr Ser Ile Gln
100 105 110
Leu Leu Met Ser Glu Pro Asn Pro Asp Asp Pro Leu Met Ala Asp Ile
115 120 125
Ser Ser Glu Phe Lys Tyr Asn Lys Pro Ala Phe Leu Lys Asn Ala Arg
130 135 140
Gln Trp Thr Glu Lys His Ala Arg Gln Lys Gln Lys Ala Asp Glu Glu
145 150 155 160
Glu Met Leu Asp Asn Leu Pro Glu Ala Gly Asp Ser Arg Val His Asn
165 170 175
Ser Thr Gln Lys Arg Lys Ala Ser Gln Leu Val Gly Ile Glu Lys Lys
180 185 190
Phe His Pro Asp Val
195
<210>59
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG50的锚定引物
<400>59
aagctttttt tttttc 16
<210>60
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG50的H-AP5引物
<400>60
aagcttagta ggc13
<210>61
<211>1936
<212>DNA
<213>人类
<400>61
ccggtagagg actgtgaacc aaaagttgtc ccccaggatg gacttcaccg cgcagcccaa60
gcctgccact gccctctgtg gcgtcgtgag tgccgacggg aagatcgctt accctccggg120
ggtaaaagag atcaccgaca agatcaccac ggacgagatg atcaaacgcc tgaagatggt180
agtgaaaacc tttatggata tggatcagga ctcagaagat gaaaaacagc agtatctccc240
actagccttg catcttgcat ctgaattctt cctcaggaac cccaataaag atgtgcgtct300
ccttgtagca tgttgtttgg ctgatatctt tcgtatctat gccccagaag ctccatatac360
ttcccatgat aaacttaagg acatattttt gtttattacc agacaattaa aaggtttgga420
ggatacaaag agtccacagt ttaatagata cttttattta ttagagaatt tagcttgggt480
taaatcatat aacatctgct ttgaattgga agattgcaat gaaattttta ttcagctttt540
tagaactctc ttctcagtga tcaacaatag ccacaataag aaggtacaaa tgcacatgct600
agatttgatg agttctatca tcatggaagg tgatggagtt actcaagaat tattggactc660
cattcttatt aacctcattc ctgcacataa gaacttaaat aaacagtcct ttgaccttgc720
aaaagtgcta ttgaaaagaa cagtccagac tattgaggca tgcattgcta attttttcaa780
tcaagtcctg gtgctgggaa gatcatcagt aagtgatttg tcagaacatg tatttgatct840
gattcaggaa ctttttgcta tagatcctca tttattatta tccgtcatgc cacagcttga900
attcaaacta aagagcaatg atggagaaga gcgattagct gttgttcgac ttctagctaa960
attgtttggc tccaaagatt ctgatttggc aacacagaat cgtcctcttt ggcaatgttt1020
tcttggacga tttaatgata ttcatgttcc tgtgagatta gaaagtgtga aatttgccag1080
tcattgttta atgaatcacc cagatttagc gaaggatctc acagaatatt taaaggttag1140
atcacatgat ccagaagaag ctattcgtca tgatgtcatt gttactataa taacagctgc1200
caagagggac ctggccttag taaatgatca gctgcttggc tttgtaaggg aaagaacact1260
ggataaacgg tggcgagtaa gaaaagaagc tatgatgggt ctggctcagc tttataagaa1320
atactgtctt catggtgaag caggaaagga agctgcagag aaagtcagct ggataaagga1380
caaacttctg catatttatt atcagaacag cattgacgac aaactgttgg tagagaaaat1440
ctttgctcgg tatcttgtcc cccacaacct ggaaacagaa gagagaatga aatgcttata1500
ttacttatat gctagtttgg atccaaatgc tgtaaaagct ctcaacgaaa tgtggaagtg1560
tcagaacatg cttcggagcc atgtacgcga actattggat ttgcacaagc agcctacatc1620
agaggctaac tgttctgcca tgtttggaaa actgatgacc atagcaaaga atttgcctga1680
ccccgggaag gcacaagatt ttgtgaagaa atttaaccag gttctcggcg atgatgagaa1740
acttcggtct cagttggagt tattaattag cccaacctgt tcttgcaaac aagcagatat1800
ttgtgtggtt agtaaatcat acttcacact ttttctctag ctttacttac agaaatatgt1860
attttattaa agcctgtttt acatacagtg atttgtgtaa atgtaacaat attgtgagct1920
ctgaattact ttggag1936
<210>62
<211>600
<212>PRT
<213>人类
<400>62
Met Asp Phe Thr Ala Gln Pro Lys Pro Ala Thr Ala Leu Cys Gly Val
1 5 10 15
Val Ser Ala Asp Gly Lys Ile Ala Tyr Pro Pro Gly Val Lys Glu Ile
20 25 30
Thr Asp Lys Ile Thr Thr Asp Glu Met Ile Lys Arg Leu Lys Met Val
35 40 45
Val Lys Thr Phe Met Asp Met Asp Gln Asp Ser Glu Asp Glu Lys Gln
50 55 60
Gln Tyr Leu Pro Leu Ala Leu His Leu Ala Ser Glu Phe Phe Leu Arg
65 70 75 80
Asn Pro Asn Lys Asp Val Arg Leu Leu Val Ala Cys Cys Leu Ala Asp
85 90 95
Ile Phe Arg Ile Tyr Ala Pro Glu Ala Pro Tyr Thr Ser His Asp Lys
100 105 110
Leu Lys Asp Ile Phe Leu Phe Ile Thr Arg Gln Leu Lys Gly Leu Glu
115 120 125
Asp Thr Lys Ser Pro Gln Phe Asn Arg Tyr Phe Tyr Leu Leu Glu Asn
130 135 140
Leu Ala Trp Val Lys Ser Tyr Asn Ile Cys Phe Glu Leu Glu Asp Cys
145 150 155 160
Asn Glu Ile Phe Ile Gln Leu Phe Arg Thr Leu Phe Ser Val Ile Asn
165 170 175
Asn Ser His Asn Lys Lys Val Gln Met His Met Leu Asp Leu Met Ser
180 185 190
Ser Ile Ile Met Glu Gly Asp Gly Val Thr Gln Glu Leu Leu Asp Ser
195 200 205
Ile Leu Ile Asn Leu Ile Pro Ala His Lys Asn Leu Asn Lys Gln Ser
210 215 220
Phe Asp Leu Ala Lys Val Leu Leu Lys Arg Thr Val Gln Thr Ile Glu
225 230 235 240
Ala Cys Ile Ala Asn Phe Phe Asn Gln Val Leu Val Leu Gly Arg Ser
245 250 255
Ser Val Ser Asp Leu Ser Glu His Val Phe Asp Leu Ile Gln Glu Leu
260 265 270
Phe Ala Ile Asp Pro His Leu Leu Leu Ser Val Met Pro Gln Leu Glu
275 280 285
Phe Lys Leu Lys Ser Asn Asp Gly Glu Glu Arg Leu Ala Val Val Arg
290 295 300
Leu Leu Ala Lys Leu Phe Gly Ser Lys Asp Ser Asp Leu Ala Thr Gln
305 310 315 320
Asn Arg Pro Leu Trp Gln Cys Phe Leu Gly Arg Phe Asn Asp Ile His
325 330 335
Val Pro Val Arg Leu Glu Ser Val Lys Phe Ala Ser His Cys Leu Met
340 345 350
Asn His Pro Asp Leu Ala Lys Asp Leu Thr Glu Tyr Leu Lys Val Arg
355 360 365
Ser His Asp Pro Glu Glu Ala Ile Arg His Asp Val Ile Val Thr Ile
370 375 380
Ile Thr Ala Ala Lys Arg Asp Leu Ala Leu Val Asn Asp Gln Leu Leu
385 390 395 400
Gly Phe Val Arg Glu Arg Thr Leu Asp Lys Arg Trp Arg Val Arg Lys
405 410 415
Glu Ala Met Met Gly Leu Ala Gln Leu Tyr Lys Lys Tyr Cys Leu His
420 425 430
Gly Glu Ala Gly Lys Glu Ala Ala Glu Lys Val Ser Trp Ile Lys Asp
435 440 445
Lys Leu Leu His Ile Tyr Tyr Gln Asn Ser Ile Asp Asp Lys Leu Leu
450 455 460
Val Glu Lys Ile Phe Ala Arg Tyr Leu Val Pro His Asn Leu Glu Thr
465 470 475 480
Glu Glu Arg Met Lys Cys Leu Tyr Tyr Leu Tyr Ala Ser Leu Asp Pro
485 490 495
Asn Ala Val Lys Ala Leu Asn Glu Met Trp Lys Cys Gln Asn Met Leu
500 505 510
Arg Ser His Val Arg Glu Leu Leu Asp Leu His Lys Gln Pro Thr Ser
515 520 525
Glu Ala Asn Cys Ser Ala Met Phe Gly Lys Leu Met Thr Ile Ala Lys
530 535 540
Asn Leu Pro Asp Pro Gly Lys Ala Gln Asp Phe Val Lys Lys Phe Asn
545 550 555 560
Gln Val Leu Gly Asp Asp Glu Lys Leu Arg Ser Gln Leu Glu Leu Leu
565 570 575
Ile Ser Pro Thr Cys Ser Cys Lys Gln Ala Asp Ile Cys Val Val Ser
580 585 590
Lys Ser Tyr Phe Thr Leu Phe Leu
595 600
<210>63
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG54的锚定引物
<400>63
aagctttttt ttttta 16
<210>64
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG54的H-AP15引物
<400>64
aagcttacgc aac13
<210>65
<211>526
<212>DNA
<213>人类
<400>65
cgcttctctg cactatgtcg ggtggcctcc tgaaggcgct gcgcagcgac tcctacgtgg60
agctgagcca gtaccgggac cagcacttcc ggggtgacaa tgaagaacaa gaaaaattac120
tgaagaaaag ctgtacgtta tatgttggaa atctttcttt ttacacaact gaagaacaaa180
tctatgaact cttcagcaaa agtggtgaca taaagaaaat cattatgggt ctggataaaa240
tgaagaaaac agcatgtgga ttctgttttg tggaatatta ctcacgcgca gatgcggaaa300
acgccatgcg gtacataaat gggacgcgtc tggatgaccg aatcattcgc acagactggg360
acgcaggctt taaggagggc aggcaatacg gccgtgggcg atctgggggc caggttcggg420
atgagtatcg gcaggactac gatgctggga gaggaggcta tggaaaactg gcacagaacc480
agtgagtggt gagagctctg tcagtgacaa acactccttt ggcctg 526
<210>66
<211>156
<212>PRT
<213>人类
<400>66
Met Ser Gly Gly Leu Leu Lys Ala Leu Arg Ser Asp Ser Tyr Val Glu
1 5 10 15
Leu Ser Gln Tyr Arg Asp Gln His Phe Arg Gly Asp Asn Glu Glu Gln
20 25 30
Glu Lys Leu Leu Lys Lys Ser Cys Thr Leu Tyr Val Gly Asn Leu Ser
35 40 45
Phe Tyr Thr Thr Glu Glu Gln Ile Tyr Glu Leu Phe Ser Lys Ser Gly
50 55 60
Asp Ile Lys Lys Ile Ile Met Gly Leu Asp Lys Met Lys Lys Thr Ala
65 70 75 80
Cys Gly Phe Cys Phe Val Glu Tyr Tyr Ser Arg Ala Asp Ala Glu Asn
85 90 95
Ala Met Arg Tyr Ile Asn Gly Thr Arg Leu Asp Asp Arg Ile Ile Arg
100 105 110
Thr Asp Trp Asp Ala Gly Phe Lys Glu Gly Arg Gln Tyr Gly Arg Gly
115 120 125
Arg Ser Gly Gly Gln Val Arg Asp Glu Tyr Arg Gln Asp Tyr Asp Ala
130 135 140
Gly Arg Gly Gly Tyr Gly Lys Leu Ala Gln Asn Gln
145 150 155
<210>67
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG55的锚定引物
<400>67
aagctttttt tttttg 16
<210>68
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG55的H-AP4引物
<400>68
aagcttctca acg13
<210>69
<211>1008
<212>DNA
<213>人类
<400>69
atggcggtgg acatcacgct gctattccgg gccagcgtca agaccgtgaa gacgcggaac60
aaggcgctgg gagtggcggt gggcggcggg gtcgatggca gccgggacga gctgttccgc120
cggagccccc ggcccaaggg cgacttctcc agccgggccc gcgaagtgat ttctcacatt180
ggcaaactga gagattttct tctggaacac aggaaagatt atattaatgc ttatagccat240
accatgtctg aatatgggag gatgacagac acagaacgag accagataga ccaggatgcc300
cagatattca tgaggacctg ttcagaagca attcagcaac tacgaacaga agctcacaag360
gagatacatt cccagcaagt gaaggagcac aggaccgctg ttttggattt cattgaagat420
tacttgaaaa gagtatgtaa actttactca gaacagagag ccatccgagt taaaagagtg480
gtggataaga aaagattatc taagctggaa ccagaaccaa atacaaagac aagagaatcc540
acatcttctg agaaagtttc acagagtcct tcaaaagact ctgaagaaaa ccctgccact600
gaagaacgtc cagaaaaaat tttggctgaa acacaacctg aattgggaac gtggggagat660
ggcaaaggcg aagatgagtt atccccagaa gaaatacaaa tgtttgaaca ggaaaatcag720
cgactaattg gtgaaatgaa cagcttgttt gatgaagtga ggcaaatcga agggagagtg780
gttgagattt ccagactcca agagatattc acggaaaagg ttttgcaaca ggaagctgag840
attgacagca ttcaccagtt agttgtgggg gcaactgaaa atatcaagga aggcaacgaa900
gacataagag aggccattaa agacaacgct ggcttccgcg tgtggatcct cttcttcctc960
gtgatgtgct ccttctcctt gctcttcctc gactggtacg acagctag 1008
<210>70
<211>335
<212>PRT
<213>人类
<400>70
Met Ala Val Asp Ile Thr Leu Leu Phe Arg Ala Ser Val Lys Thr Val
1 5 10 15
Lys Thr Arg Asn Lys Ala Leu Gly Val Ala Val Gly Gly Gly Val Asp
20 25 30
Gly Ser Arg Asp Glu Leu Phe Arg Arg Ser Pro Arg Pro Lys Gly Asp
35 40 45
Phe Ser Ser Arg Ala Arg Glu Val Ile Ser His Ile Gly Lys Leu Arg
50 55 60
Asp Phe Leu Leu Glu His Arg Lys Asp Tyr Ile Asn Ala Tyr Ser His
65 70 75 80
Thr Met Ser Glu Tyr Gly Arg Met Thr Asp Thr Glu Arg Asp Gln Ile
85 90 95
Asp Gln Asp Ala Gln Ile Phe Met Arg Thr Cys Ser Glu Ala Ile Gln
100 105 110
Gln Leu Arg Thr Glu Ala His Lys Glu Ile His Ser Gln Gln Val Lys
115 120 125
Glu His Arg Thr Ala Val Leu Asp Phe Ile Glu Asp Tyr Leu Lys Arg
130 135 140
Val Cys Lys Leu Tyr Ser Glu Gln Arg Ala Ile Arg Val Lys Arg Val
145 150 155 160
Val Asp Lys Lys Arg Leu Ser Lys Leu Glu Pro Glu Pro Asn Thr Lys
165 170 175
Thr Arg Glu Ser Thr Ser Ser Glu Lys Val Ser Gln Ser Pro Ser Lys
180 185 190
Asp Ser Glu Glu Asn Pro Ala Thr Glu Glu Arg Pro Glu Lys Ile Leu
195 200 205
Ala Glu Thr Gln Pro Glu Leu Gly Thr Trp Gly Asp Gly Lys Gly Glu
210 215 220
Asp Glu Leu Ser Pro Glu Glu Ile Gln Met Phe Glu Gln Glu Asn Gln
225 230 235 240
Arg Leu Ile Gly Glu Met Asn Ser Leu Phe Asp Glu Val Arg Gln Ile
245 250 255
Glu Gly Arg Val Val Glu Ile Ser Arg Leu Gln Glu Ile Phe Thr Glu
260 265 270
Lys Val Leu Gln Gln Glu Ala Glu Ile Asp Ser Ile His Gln Leu Val
275 280 285
Val Gly Ala Thr Glu Asn Ile Lys Glu Gly Asn Glu Asp Ile Arg Glu
290 295 300
Ala Ile Lys Asp Asn Ala Gly Phe Arg Val Trp Ile Leu Phe Phe Leu
305 310 315 320
Val Met Cys Ser Phe Ser Leu Leu Phe Leu Asp Trp Tyr Asp Ser
325 330 335
<210>71
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于GIG9的锚定引物
<400>71
aagctttttt ttttta 16
<210>72
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于GIG9的H-AP14引物
<400>72
aagcttggag ctt13
<210>73
<211>1382
<212>DNA
<213>人类
<400>73
agcagggtca ccatttgcag cgcaacatgg caggagctgg aggagggaat gatattcagt60
ggtgtttttc tcaggtgaaa ggagcagtag atgatgatgt agcagaagca gatataattt120
ctacagtaga atttaatcat tctggagaat tactagcaac aggagataaa ggtggtagag180
ttgtcatctt tcaacaggag caggagaaca aaatccagtc tcatagcaga ggagaatata240
atgtttacag caccttccag agccatgaac cagagtttga ctacttgaaa agtttagaaa300
tagaagaaaa gatcaacaaa attaggtggt taccccagaa aaatgctgct cagtttttat360
tgtctaccaa tgataaaaca ataaaattat ggaaaatcag tgaaagggac aaaagaccag420
aagggtataa cttgaaagag gaggatggaa ggtatagaga tcctactaca gttactacac480
tacgagtgcc agtctgtagg cctatggatc taatggttga ggccagtcca cgaagaatat540
ttgccaatgc tcatacatat cacatcaact caatttctat taatagtgat tatgaaacat600
atttatctgc agatgatttg cggattaatc tttggcatct ggaaattaca gacaggagtt660
ttaacattgt ggatatcaag cctgccaata tggaagagct aacagaggtg attacagcag720
cagaatttca tccaaacagc tgtaacacat ttgtatacag cagcagtaaa ggaactattc780
ggctatgtga catgagggca tctgccctct gtgatagaca ttctaaattg tttgaagaac840
ctgaagatcc cagtaacagg tcattttttt ccgaaatcat ctcctctatt tcggatgtaa900
aattcagcca tagtggtcga tacatgatga ctagagacta tttgtcagtc aaaatttggg960
acttaaatat ggaaaacagg cctgtggaaa cataccaggt gcatgaatac ctcagaagta1020
aactctgttc actgtacgaa aatgactgca tatttgacaa atttgaatgt tgttggaatg1080
gatctgacag tgttgtcatg actggatctt acaataattt cttcagaatg tttgacagaa1140
acacaaagcg agacataacc ctagaagcat cgcgggaaaa caataagcct cgcacagttc1200
tgaagcctcg caaagtctgt gcaagtggca agcgaaagaa agatgaaata agtgttgaca1260
gcctagactt caataagaaa atccttcaca cagcctggca ccccaaggaa aatatcattg1320
ccgtagctac tacaaacaat ctgtatatat ttcaagacaa agtgaattag ggttggcatt1380
cc 1382
<210>74
<211>447
<212>PRT
<213>人类
<400>74
Met Ala Gly Ala Gly Gly Gly Asn Asp Ile Gln Trp Cys Phe Ser Gln
1 5 10 15
Val Lys Gly Ala Val Asp Asp Asp Val Ala Glu Ala Asp Ile Ile Ser
20 25 30
Thr Val Glu Phe Asn His Ser Gly Glu Leu Leu Ala Thr Gly Asp Lys
35 40 45
Gly Gly Arg Val Val Ile Phe Gln Gln Glu Gln Glu Asn Lys Ile Gln
50 55 60
Ser His Ser Arg Gly Glu Tyr Asn Val Tyr Ser Thr Phe Gln Ser His
65 70 75 80
Glu Pro Glu Phe Asp Tyr Leu Lys Ser Leu Glu Ile Glu Glu Lys Ile
85 90 95
Asn Lys Ile Arg Trp Leu Pro Gln Lys Asn Ala Ala Gln Phe Leu Leu
100 105 110
Ser Thr Asn Asp Lys Thr Ile Lys Leu Trp Lys Ile Ser Glu Arg Asp
115 120 125
Lys Arg Pro Glu Gly Tyr Asn Leu Lys Glu Glu Asp Gly Arg Tyr Arg
130 135 140
Asp Pro Thr Thr Val Thr Thr Leu Arg Val Pro Val Cys Arg Pro Met
145 150 155 160
Asp Leu Met Val Glu Ala Ser Pro Arg Arg Ile Phe Ala Asn Ala His
165 170 175
Thr Tyr His Ile Asn Ser Ile Ser Ile Asn Ser Asp Tyr Glu Thr Tyr
180 185 190
Leu Ser Ala Asp Asp Leu Arg Ile Asn Leu Trp His Leu Glu Ile Thr
195 200 205
Asp Arg Ser Phe Asn Ile Val Asp Ile Lys Pro Ala Asn Met Glu Glu
210 215 220
Leu Thr Glu Val Ile Thr Ala Ala Glu Phe His Pro Asn Ser Cys Asn
225 230 235 240
Thr Phe Val Tyr Ser Ser Ser Lys Gly Thr Ile Arg Leu Cys Asp Met
245 250 255
Arg Ala Ser Ala Leu Cys Asp Arg His Ser Lys Leu Phe Glu Glu Pro
260 265 270
Glu Asp Pro Ser Asn Arg Ser Phe Phe Ser Glu Ile Ile Ser Ser Ile
275 280 285
Ser Asp Val Lys Phe Ser His Ser Gly Arg Tyr Met Met Thr Arg Asp
290 295 300
Tyr Leu Ser Val Lys Ile Trp Asp Leu Asn Met Glu Asn Arg Pro Val
305 310 315 320
Glu Thr Tyr Gln Val His Glu Tyr Leu Arg Ser Lys Leu Cys Ser Leu
325 330 335
Tyr Glu Asn Asp Cys Ile Phe Asp Lys Phe Glu Cys Cys Trp Asn Gly
340 345 350
Ser Asp Ser Val Val Met Thr Gly Ser Tyr Asn Asn Phe Phe Arg Met
355 360 365
Phe Asp Arg Asn Thr Lys Arg Asp Ile Thr Leu Glu Ala Ser Arg Glu
370 375 380
Asn Asn Lys Pro Arg Thr Val Leu Lys Pro Arg Lys Val Cys Ala Ser
385 390 395 400
Gly Lys Arg Lys Lys Asp Glu Ile Ser Val Asp Ser Leu Asp Phe Asn
405 410 415
Lys Lys Ile Leu His Thr Ala Trp His Pro Lys Glu Asn Ile Ile Ala
420 425 430
Val Ala Thr Thr Asn Asn Leu Tyr Ile Phe Gln Asp Lys Val Asn
435 440 445
<210>75
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于HLC-9的锚定引物
<400>75
aagctttttt tttttg 16
<210>76
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于HLC-9的H-AP7引物
<400>76
aagcttaacg agg13
<210>77
<211>1301
<212>DNA
<213>人类
<400>77
atatggcacc tccgtcagtc tttgccgagg ttccgcaggc ccagcctgtc ctggtcttca60
agctcactgc cgacttcagg gaggatccgg acccccgcaa ggtcaacctg ggagtgggag120
catatcgcac ggatgactgc catccctggg ttttgccagt agtgaagaaa gtggagcaga180
agattgctaa tgacaatagc ctaaatcacg agtatctgcc aatcctgggc ctggctgagt240
tccggagctg tgcttctcgt cttgcccttg aggatgacag cccagcactc aaggagaagc300
gggtaggagg tgtgcaatct ttggggggaa caggtgcact tcgaattgga gctgatttct360
tagcgcgttg gtacaatgga acaaacaaca agaacacacc tgtctatgtg tcctcaccaa420
cctgggagaa tcacaatgct gtgttttccg ctgctggttt taaagacatt cggtcctatc480
gctactggga tgcagagaag agaggattgg acctccaggg cttcctgaat gatctggaga540
atgctcctga gttctccatt gttgtcctcc acgcctgtgc acacaaccca actgggattg600
acccaactcc ggagcagtgg aagcagattg cttctgtcat gaagcaccgg tttctgttcc660
ccttctttga ctcagcctat cagggcttcg catctggaaa cctggagaga gatgcctggg720
ccattcgcta ttttgtgtct gaaggcttcg agttcttctg tgcccagtcc ttctccaaga780
acttcgggct ctacaatgag agagtcggga atctgactgt ggttggaaaa gaacctgaga840
gcatcctgca agtcctttcc cagatggaga agatcgtgcg gattacttgg tccaatcccc900
ccgcccaggg agcacgaatt gtggccagca ccctctctaa ccctgagctc tttgaggaat960
ggacaggtaa tgtgaagaca atggctgacc ggattctgac catgagatct gaactcaggg1020
cacgactaga agccctcaaa acccctggga cctggaacca catcactgat caaattggca1080
tgttcagctt cactgggttg aaccccaagc aggttgagta tctggtcaat gaaaagcaca1140
tctacctgct gccaagtggt cgaatcaacg tgagtggctt aaccaccaaa aatctagatt1200
acgtggccac ctccatccat gaagcagtca ccaaaatcca gtgaagaaac accacccgtc1260
cagtaccacc aaagtagttc tctgtcatgt gtgttccctg c1301
<210>78
<211>413
<212>PRT
<213>人类
<400>78
Met Ala Pro Pro Ser Val Phe Ala Glu Val Pro Gln Ala Gln Pro Val
1 5 10 15
Leu Val Phe Lys Leu Thr Ala Asp Phe Arg Glu Asp Pro Asp Pro Arg
20 25 30
Lys Val Asn Leu Gly Val Gly Ala Tyr Arg Thr Asp Asp Cys His Pro
35 40 45
Trp Val Leu Pro Val Val Lys Lys Val Glu Gln Lys Ile Ala Asn Asp
50 55 60
Asn Ser Leu Asn His Glu Tyr Leu Pro Ile Leu Gly Leu Ala Glu Phe
65 70 75 80
Arg Ser Cys Ala Ser Arg Leu Ala Leu Glu Asp Asp Ser Pro Ala Leu
85 90 95
Lys Glu Lys Arg Val Gly Gly Val Gln Ser Leu Gly Gly Thr Gly Ala
100 105 110
Leu Arg Ile Gly Ala Asp Phe Leu Ala Arg Trp Tyr Asn Gly Thr Asn
115 120 125
Asn Lys Asn Thr Pro Val Tyr Val Ser Ser Pro Thr Trp Glu Asn His
130 135 140
Asn Ala Val Phe Ser Ala Ala Gly Phe Lys Asp Ile Arg Ser Tyr Arg
145 150 155 160
Tyr Trp Asp Ala Glu Lys Arg Gly Leu Asp Leu Gln Gly Phe Leu Asn
165 170 175
Asp Leu Glu Asn Ala Pro Glu Phe Ser Ile Val Val Leu His Ala Cys
180 185 190
Ala His Asn Pro Thr Gly Ile Asp Pro Thr Pro Glu Gln Trp Lys Gln
195 200 205
Ile Ala Ser Val Met Lys His Arg Phe Leu Phe Pro Phe Phe Asp Ser
210 215 220
Ala Tyr Gln Gly Phe Ala Ser Gly Asn Leu Glu Arg Asp Ala Trp Ala
225 230 235 240
Ile Arg Tyr Phe Val Ser Glu Gly Phe Glu Phe Phe Cys Ala Gln Ser
245 250 255
Phe Ser Lys Asn Phe Gly Leu Tyr Asn Glu Arg Val Gly Asn Leu Thr
260 265 270
Val Val Gly Lys Glu Pro Glu Ser Ile Leu Gln Val Leu Ser Gln Met
275 280 285
Glu Lys Ile Val Arg Ile Thr Trp Ser Asn Pro Pro Ala Gln Gly Ala
290 295 300
Arg Ile Val Ala Ser Thr Leu Ser Asn Pro Glu Leu Phe Glu Glu Trp
305 310 315 320
Thr Gly Asn Val Lys Thr Met Ala Asp Arg Ile Leu Thr Met Arg Ser
325 330 335
Glu Leu Arg Ala Arg Leu Glu Ala Leu Lys Thr Pro Gly Thr Trp Asn
340 345 350
His Ile Thr Asp Gln Ile Gly Met Phe Ser Phe Thr Gly Leu Asn Pro
355 360 365
Lys Gln Val Glu Tyr Leu Val Asn Glu Lys His Ile Tyr Leu Leu Pro
370 375 380
Ser Gly Arg Ile Asn Val Ser Gly Leu Thr Thr Lys Asn Leu Asp Tyr
385 390 395 400
Val Ala Thr Ser Ile His Glu Ala Val Thr Lys Ile Gln
405 410
<210>79
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于GIG18的锚定引物
<400>79
aagctttttt tttttc 16
<210>80
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于GIG18的H-AP4引物
<400>80
aagcttctca acg13
<210>81
<211>749
<212>DNA
<213>人类
<400>81
gcgactgaag cagcatggcc aagccgtgtg gggtgcgcct gagcggggaa gcccgcaaac60
aggtggaggt cttcaggcag aatcttttcc aggaggctga ggaattcctc tacagattct120
tgccacagaa aatcatatac ctgaatcagc tcttgcaaga ggactccctc aatgtggctg180
acttgacttc cctccgggcc ccactggaca tccccatccc agaccctcca cccaaggatg240
atgagatgga aacagataag caggagaaga aagaagtccc taagtgtgga tttctccctg300
ggaatgagaa agtcctgtcc ctgcttgccc tggttaagcc agaagtctgg actctcaaag360
agaaatgcat tctggtgatt acatggatcc aacacctgat ccccaagatt gaagatggaa420
atgattttgg ggtagcaatc caggagaagg tgctggagag ggtgaatgcc gtcaagacca480
aagtggaagc tttccagaca accatttcca agtacttctc agaacgtggg gatgctgtgg540
ccaaggcctc caaggagacc catgtaatgg attaccgggc cttggtgcat gagcgagatg600
aggcagccta tggggagctc agggccatgg tgctggacct gagggccttc tatgctgagc660
tttatcatat catcagcagc aacctggaga aaattgtcac cccaaagggt gaagaaaagc720
catctatgta ctgaacccgg gactagaag 749
<210>82
<211>239
<212>PRT
<213>人类
<400>82
Met Ala Lys Pro Cys Gly Val Arg Leu Ser Gly Glu Ala Arg Lys Gln
1 5 10 15
Val Glu Val Phe Arg Gln Asn Leu Phe Gln Glu Ala Glu Glu Phe Leu
20 25 30
Tyr Arg Phe Leu Pro Gln Lys Ile Ile Tyr Leu Asn Gln Leu Leu Gln
35 40 45
Glu Asp Ser Leu Asn Val Ala Asp Leu Thr Ser Leu Arg Ala Pro Leu
50 55 60
Asp Ile Pro Ile Pro Asp Pro Pro Pro Lys Asp Asp Glu Met Glu Thr
65 70 75 80
Asp Lys Gln Glu Lys Lys Glu Val Pro Lys Cys Gly Phe Leu Pro Gly
85 90 95
Asn Glu Lys Val Leu Ser Leu Leu Ala Leu Val Lys Pro Glu Val Trp
100 105 110
Thr Leu Lys Glu Lys Cys Ile Leu Val Ile Thr Trp Ile Gln His Leu
115 120 125
Ile Pro Lys Ile Glu Asp Gly Asn Asp Phe Gly Val Ala Ile Gln Glu
130 135 140
Lys Val Leu Glu Arg Val Asn Ala Val Lys Thr Lys Val Glu Ala Phe
145 150 155 160
Gln Thr Thr Ile Ser Lys Tyr Phe Ser Glu Arg Gly Asp Ala Val Ala
165 170 175
Lys Ala Ser Lys Glu Thr His Val Met Asp Tyr Arg Ala Leu Val His
180 185 190
Glu Arg Asp Glu Ala Ala Tyr Gly Glu Leu Arg Ala Met Val Leu Asp
195 200 205
Leu Arg Ala Phe Tyr Ala Glu Leu Tyr His Ile Ile Ser Ser Asn Leu
210 215 220
Glu Lys Ile Val Thr Pro Lys Gly Glu Glu Lys Pro Ser Met Tyr
225 230 235
<210>83
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于MIG22的锚定引物
<400>83
aagctttttt ttttta 16
<210>84
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于MIG22的H-AP6引物
<400>84
aagcttgcac cat 1权利要求
1.一种人类原癌蛋白，其具有选自由SEQ ID NO2；SEQ ID NO6；SEQID NO10；SEQ ID NO14；SEQ ID NO18；SEQ ID NO22；SEQ ID NO26；SEQ ID NO30；SEQ ID NO34；SEQ ID NO38；SEQ ID NO42；SEQ ID NO46；SEQ ID NO50；SEQ ID NO54；SEQ ID NO58；SEQ ID NO62；SEQID NO66；SEQ ID NO70；SEQ ID NO74；SEQ ID NO78；和SEQ ID NO82组成的组的氨基酸序列。
2.一种人类原癌基因，其具有选自由对应于SEQ ID NO1的68～1,252核苷酸序列位置的DNA序列；对应于SEQ ID NO5的875～1,063核苷酸序列位置的DNA序列；对应于SEQ ID NO9的25～1,953核苷酸序列位置的DNA序列；对应于SEQ ID NO13的20～337核苷酸序列位置的DNA序列；对应于SEQ ID NO17的33～998核苷酸序列位置的DNA序列；对应于SEQID NO21的6～2,150核苷酸序列位置的DNA序列；对应于SEQ ID NO25的37～2,232核苷酸序列位置的DNA序列；对应于SEQ ID NO29的25～1,956核苷酸序列位置的DNA序列；对应于SEQ ID NO33的36～1,541核苷酸序列位置的DNA序列；对应于SEQ ID NO37的57～758核苷酸序列位置的DNA序列；对应于SEQ ID NO41的55～1,512核苷酸序列位置的DNA序列；对应于SEQ ID NO45的5～1,297核苷酸序列位置的DNA序列；对应于SEQ ID NO49的56～826核苷酸序列位置的DNA序列；对应于SEQ ID NO53的57～1,694核苷酸序列位置的DNA序列；对应于SEQ ID NO57的2～595核苷酸序列位置的DNA序列；对应于SEQ ID NO61的38～1,840核苷酸序列位置的DNA序列；对应于SEQ ID NO65的15～485核苷酸序列位置的DNA序列；对应于SEQ ID NO69的1～1,008核苷酸序列位置的DNA序列；对应于SEQ ID NO73的27～1,370核苷酸序列位置的DNA序列；对应于SEQ ID NO77的3～1,244核苷酸序列位置的DNA序列；以及对应于SEQID NO81的15～734核苷酸序列位置的DNA序列组成的组的DNA序列，其中该DNA序列分别编码如权利要求1所述的原癌蛋白。
3.一种用于诊断癌症的试剂盒，其包括如权利要求1所述的原癌蛋白。
4.一种用于诊断癌症的试剂盒，其包括如权利要求2所述的原癌基因。
全文摘要
本发明披露了一种新的原癌基因和该原癌基因编码的蛋白质。本发明的原癌基因可有效地用于诊断包括乳腺癌、白血病、子宫癌、恶性淋巴瘤等的多种癌症。
文档编号C07K14/435GK101184772SQ200680018552
公开日2008年5月21日申请日期2006年3月30日优先权日2005年3月30日
发明者金弦起, 金振宇申请人:金弦起

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：金弦起;金振宇
技术所有人：金弦起
我是此专利的发明人

上一篇：用于交叉偶联反应的Pd(acac)<sub>2</sub>的亲核杂环卡宾衍生物的制作方法
上一篇：化合物和有机发光器件的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
2、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
3、赵老师：1.电化学离子储存和分离技术 2.工业结晶
4、廖老师：1. 晶面可控氧化铝、碳基载体及催化剂等高性能、新结构催化材料研究 2. 乙烯环氧化催化剂的研究与开发 3. 低碳不饱和烯烃的选择性氧化催化剂及工业技术开发
5、李老师：1. 加氢精制 2. 选择加氢 3. 加氢脱氧 4. 介孔及介微孔分子筛合成及催化应用
如您是高校老师，可以点此联系我们加入专家库。