专利名称:Il-1基因簇和相关的炎性多态性和单倍型的制作方法
1.发明背景IL-1是一种主要的炎性细胞因子,并已经涉及介导急性和慢性病理性炎性疾病。两个功能类似的分子,IL-1α和IL-1β,由单独的基因编码(分别地,IL1A和IL1B)。家族的第三个基因(IL1RN)编码IL-1受体拮抗剂(IL-1ra),一种抗炎非信号分子,其与受体竞争结合IL-1α和IL-1β。IL-1α,IL-1β和IL-1ra的成对比较在每种情形中产生<25%的同一性,而IL-1β和IL-1ra的X-射线晶体分析法显示紧密类似的折叠(Priestle等(1989)PNASUSA 869667-967);Vigers等(1994)Biol Chem 26912874-12879)。在结构上,蛋白质由称为β-三叶(trefoil)的12个装配的β-折叠的单个结构域组成。因为大多数装配相互作用的特征在于主链原子,已经争论少数不变的氨基酸是产生IL-1折叠必需的残基,因此基因编码序列的广泛多样化已经可能。在大豆胰蛋白酶抑制剂中获得非常类似的折叠,而无任何可检测的序列相似性。所有三种蛋白质仅结合IL-1的功能信号受体,I型IL-1受体(IL-1R1)(参见Sims等(1993)PNAS USA 906155-6159)。
已经表征IL-1主要作为受激的单核细胞,巨噬细胞和角质细胞的产物,但对于从平滑肌和内皮细胞释放的IL-1已经提示重要作用(综述于Ross(1993)Nature 362801-9)。通过IL-1R1的信号涉及受体的胞质类似Toll的结构域(Heguy等,(1992).J Biol Chem 2672605-2609)。功能性IL-1受体广泛分布于组织中。当前认为IL-1ra不同于IL-1,其不能激活IL-1R1和第二受体元件,IL-1受体辅助蛋白,IL-1RacP之间的相互作用。这是一种跨膜蛋白,其为IL-1R1的远亲,具有类似的结构域结构,但对IL-1不具有内在的亲和力(Greenfeder等,(1995)J Biol Chem 27013757-13756;Wesche等,(1997)J Biol Chem 2727727-7731)。
IL-1基因簇在染色体2的长臂上(2q13),在430Kb的区域内包含至少关于IL-1α(IL-1A),IL-1β(IL-1B),和IL-1受体拮抗剂(IL-1RN)的基因(Nicklin,等(1994)Genomics,19382-4)。通过人基因组DNA限制酶切消化物的脉冲场凝胶电泳已经估计远端基因IL1A和IL1RN的最大间隔为430kb(Nicklin,等(1994)Genomics,19382-4),通过物理克隆的序列分析已经确定三个基因的定向(Nothwang等(1997)Genomics 41370-378)。IL-18似乎是IL-1结构家族的第四个成员(Bazan等(1996)Nature379591)。它也是一种促炎细胞因子,但其活性类似于IL-1。IL-18与相关受体(IL-18R1)而不与IL-1R1结合(Torigoe等(1997)J Biol Chem 27225737-25742),其涉及有关辅助蛋白,IL-18RacP,而不是IL-1RacP(Bom等(1998)。IL-18基因,IL18,位于染色体11上(Nolan等,(1998)Genomics51161-3)。
从商业和公共cDNA数据库中已经鉴定某些其它包含类似IL-1的元件的蛋白质(Mulero等(1999)Biochem Biophys Res Commun 5702-6;Smith等(2000)J Biol Chem 2751169-1175);Kumar等,(2000)J Biol Chem 27510308-10314;Busfield等(2000)Genomics 66213-216;Lin等(2001)J BiolChem 27620597-20602)。在cDNA选择后通过与结合IL-1簇的YAC克隆杂交也鉴定了一个类IL-1基因(Barton等,(2000)Eur J Immunol 303299-3308)。该IL-1基因及其产物(即类白细胞介素-1的蛋白质1基因/产物)在我们待审批的申请U.S.S.N.09/617720中详述,该申请的内容结合于此作为参考。对于这6个新基因的统一命名系统最近已经为涉及基因发现的研究者所认可(参见Sims等(2001)Trends Immunol 22536-537),并将用于本文。识别4个先前已知的IL-1家族成员,新的人基因已经命名为IL1F5,IL1F6,IL1F7,IL1F8(即IL-IL1),IL1F9和IL1F10。蛋白质产物以该方式命名,IL-1F7b(其将意指IL1F7基因的第二个所述推定的蛋白产物)。基因通常似乎在人和小鼠之间保守。
由此其内容全部结合美国专利No.6,268,142中作为参考,我们先前已经描述了与IL-1炎性单倍型有关的某些多态性,包括SNP,及它们在炎性疾病诊断和治疗中的应用。在U.S.S.N.09/617720和U.S.S.N.09/969,215[公开号US 2002/0182612]中,由此其内容全部结合,我们先前已经描述基于IL-1B等位基因2(+6912)的多态性的治疗和诊断。另外,在U.S.S.N.010/300011(也为PCT US 02/37222)中,其内容也由此完整地结合,我们描述和表征功能多态性,包括IL-1B基因上游区域影响转录和对炎性疾病和传染病的易感性的那些。另外,在U.S.S.N.09/617720中,其内容由此完整地结合,我们先前描述类IL-1基因及其产物(即类白细胞介素-1蛋白1基因/产物,即IL-1F8)。认识到整个IL-1基因的基因座主要涉及炎性疾病,我们于此提供另外的详细的IL-1基因座多态性,连锁,疾病相关和功能分析,其支持组合物用于检测人IL-1基因座的遗传同一性以及它们在预测、诊断和治疗炎性疾病中的应用。
2.发明概述通常本发明提供用于检测IL-1单倍型(例如与发展炎性疾病或症状增加的风险或降低的风险有关的IL-1单倍型)的组合物和方法。在优选实施方案中,IL-1单倍型与发展疾病或症状的增加的风险或降低的风险有关,然而本发明必定包括用于检测与发展炎性疾病或症状增加的风险及降低的风险无关的IL-1单倍型的材料和方法(例如“正常”或“野生型”基因型)。
在优选实施方案中,本发明提供用于通过检测与炎性疾病或症状有关的IL-1等位基因或与该等位基因连锁不平衡的任何IL-1等位基因,例如一个或多个如
图1,2A,2B,7A或7B中任何一个所示的连锁的IL-1等位基因来确定受试者是否患有或倾向于发展与IL-1炎性单倍型有关的疾病或症状的组合物和方法。在优选实施方案中,连锁的等位基因与炎性相关等位基因具有至少0.5和优选至少0.6,0.7,0.8或0.9的连锁不平衡值(D’)。
在另一实施方案中,本发明提供用于通过检测与炎性疾病或症状降低的风险有关的IL-1等位基因或与该“保护性的”等位基因连锁不平衡的任何IL-1等位基因,例如一个或多个如图1,2A,2B,7A或7B中任何一个所示的连锁的IL-1等位基因来确定受试者是否具有降低的发展疾病或症状的风险的组合物和方法,所述疾病或症状与IL-1炎性单倍型有关。在优选实施方案中,连锁的等位基因与“保护性的”等位基因具有至少0.5和优选至少0.6,0.7,0.8或0.9的连锁不平衡值(D’)。在某些优选实施方案中,基于新鉴定的SNP,本发明包括4种新的IL-1单倍型(hap1-4)。在一个优选的实施方案中,本发明提供hap1(IL-1单倍型型式1)和IL-1促炎(与前述单倍型3322146121一致),其包括IL-1A(+4845)等位基因2(与IL-IA(-889)等位基因2100%LD);IL-1B(+3954)等位基因2;和IL-1B(-511)等位基因1。在另一实施方案中,本发明提供hap1单倍型,其包含如图3A和3B所示的多种两个或多个等位基因的hap1单倍型型式。在优选实施方案中,hap1单倍型包括图3A和B所示的IL-1TTC/2-2-1型式。
在另一实施方案中,本发明提供与前述单倍型4411233212一致的IL-1单倍型,hap2,其包括IL-1A(+4845)等位基因1(与IL-1A(-889)等位基因1100%LD);IL-1B(+3954)等位基因1IL-1B(-511)等位基因2。在另一实施方案中,本发明提供hap2单倍型,其包含如图4A和4B所示的多种两个或多个等位基因的hap2单倍型型式。在优选实施方案中,hap2单倍型包括图4A和4B所示的IL-1 GCT/1-1-2型式。
在还有另一实施方案中,本发明提供与前述(“野生型”)等位基因型**111***一致的IL-1单倍型,hap3,其包括IL-1A(+4845)等位基因1(与IL-1A(-889)等位基因1 100%LD);IL-1B(+3954)等位基因1;和IL-1B(-511)等位基因1。在优选实施方案中,本发明提供hap3单倍型,其包含如图5A和5B所示的多种两个或多个等位基因的hap3单倍型型式。在优选实施方案中,hap3单倍型包括如图5A和5B所示的IL-1hap3GCC/1-1-1型式。
在还有另一实施方案中,本发明提供与新IL-1单倍型型式(hap4)一致的新鉴定的SNP,其包含IL-1B(+3954)等位基因;IL-1B(-511)等位基因1;和IL-1B(-3737)等位基因1。在一个优选实施方案中,本发明提供hap4单倍型,其包含如图6A和6B所示的多种两个或多个等位基因的hap4单倍型型式。在优选实施方案中,hap3单倍型包括如图6A和6B所示的IL-1hap4CCC/1-1-1型式。
本发明另一目的是提供涉及来自IL-1基因簇和特别是来自IL-1簇的新的类IL-1基因的序列信息的应用的方法和组合物。另一目的是将该序列信息与遗传数据结合。因此,本发明提供IL-1簇的图谱,其提供关于基因的结构和组构和相关多态性的详细信息。本发明还有一个目的是提供预测和诊断与IL-1基因簇有关的疾病或症状的方法。另一个目的是提供多种人IL-1基因簇序列标识符(identifier),其包含一个或多个用于鉴定IL-1多态性的核酸,如图4所示。
3.附图简述图1用示意图表示在整个IL-1基因簇的基因座中代表性的SNP的连锁不平衡。
图2(A和B)显示在整个IL-1基因簇中代表性的SNP的连锁不平衡定量值(D’值在对角线下出现)和它们的统计学显著性(1-p值在对角线上出现)。
图3(A和B)显示IL-1单倍型型式1(hap1)的SNP组构(T-T-C=2_2_1)。
图4(A和B)显示IL-1单倍型型式2(hap2)的SNP组构(G-C-T=1_1_2)。
图5(A和B)显示IL-1单倍型型式3(hap3)的SNP组构(G-C-C=1_1_1)。
图6(A和B)显示IL-1单倍型型式4(hap4)的SNP组构(C-C-C=1_1_1)。
图7(A和B)显示强烈连锁不平衡和未特别地包括在LD表中的SNP。
图8显示IL-1A基因多态性的同一性和位置。
图9显示IL-1B基因多态性的同一性和位置。
图10(A和B)显示IL-1RNic基因多态性的同一性和位置。
图11显示IL-1RNsec基因多态性的同一性和位置。
图12显示对应于IL-1A+4845等位基因1和2的IL-1α变体在通过钙蛋白酶蛋白酶裂解中的差异。
图13显示用表达IL-1+4845等位基因1和2变体的载体稳定转染的成纤维细胞增殖的速率。
图14(A和B)显示IL-1A SNP构建体的基因型(A)和在成纤维细胞系中所选报告基因的活性(B)。
图15(A,B,C,和D)显示IL-1B SNP构建体的基因型(A)和在成纤维细胞系中所选报告基因的活性(B);以及另外一组IL-1B构建体的基因型,其中等位基因2出现在位置14和15(C)和在成纤维细胞系中所选报告基因的活性(D)。
图16(A和B)显示IL-1RN SNP构建体的基因型(A)和在成纤维细胞系中所选报告基因的活性(B)。
图17显示IL-1基因簇的图谱。在数据之上和之下提供刻度线(kb)以帮助对比。
图18(A-G)显示10个已知的IL-1家族成员的3个共有外显子编码序列的对比。
图19显示在IL-1基因簇内选择多态性标记的图谱位置。
4.发明详述4.1.概述几种细胞因子白细胞介素(IL)-1基因的同系物对先前鉴定的IL-1基因簇作图,但该区域的公共测序相对较慢。我们因此构建整个簇的重叠群并注释它。另外,已经定位在该基因簇(包括IL-1A,IL-1B和IL-RN中的SNP)中的新的人多态性基因座和相关的IL-1单倍型,并如图1-11所概述鉴定。在后附的本发明和实施例的详细描述中进一步举例说明本发明的特征。
4.2.定义为了方便起见,下面提供在本说明书,实施例,和后附权利要求中使用的某些术语和短语的含义。
术语“等位基因”是指在不同多态区域发现的不同序列变体。例如IL-1RN(VNTR)具有至少5个不同的等位基因。序列变体可以是单个或多个碱基变化,无限制地包括插入,缺失,或替代,或可以是可变数量的序列重复。
术语“等位基因型”是指一个等位基因或多个等位基因在一个或多个多态区域的同一性。例如,等位基因型可以由在一个多态位点的单个等位基因组成,关于IL-1RN(VNTR)等位基因1,其是在IL-1RN基因座的VNTR处具有至少一个拷贝的IL-1RN等位基因1的等位基因型。备选地,等位基因型可以由单个多态位点的纯合或杂合状态组成。例如,IL1-RN(VNTR)等位基因2,2是这样的等位基因型,其中存在两拷贝的对应于纯合IL-RN(VNTR)等位基因2状态的IL-1RN的VNTR标记的第二个等位基因。备选地,等位基因型可以由在多于一个多态位点的等位基因的同一性组成。
术语“抗体”在本文中意欲是指与IL-1多态特异性反应的结合剂,其包括整个抗体或其结合片段。使用常规技术可以将抗体片段化,以与上述对于完整抗体的相同方式筛选片段的效用。例如,通过用胃蛋白酶处理抗体可以产生F(ab)2片段。可以处理得到的F(ab)2片段以还原二硫键产生Fab片段。本发明的抗体另外意欲包括双特异性的,单链的,和嵌合和人源化的分子,其具有由抗体的至少一个CDR区域赋予的对IL-1B多肽的亲和力。
可以交换使用的“生物学活性”或“生物活性”或“活性”或“生物学功能”在此是意指通过IL-1多肽(无论是它的天然或变性构象)或通过其任何子序列直接或间接实施的效应物或抗原功能。生物学活性包括与靶肽,例如IL-1受体结合。可以通过直接影响IL-1多肽来调节IL-1生物活性。备选地,通过调节IL-1多肽的水平,如通过调节IL-1基因的表达,可以调节IL-1生物活性。
如本文所用,术语“IL-1多肽的生物活性片段”是指全长IL-1多肽的片段,其中该片段特异性地模拟或拮抗野生型IL-1多肽的活性。生物活性片段优选是能够与白细胞介素受体相互作用的片段。
术语“异常活性”,如应用于多肽如IL-1的活性,是指这样的活性,其不同于野生型或天然多肽的活性或不同于健康受试者中多肽的活性。因为它强于它的天然对应物的活性,所以多肽活性可以是异常的。备选地,因为它相对于它的天然对应物的活性较弱或缺乏,活性可以是异常的。异常活性还可以是活性的变化。例如异常多肽可以与不同靶肽相互作用。由于编码IL-1基因座多肽的IL-1基因座基因的过表达或表达不足(underexpression),细胞可以具有异常的IL-1活性。
“细胞”,“宿主细胞”或“重组宿主细胞”在本文中是可以交换使用的术语,不仅是指特定的受试者细胞,而且指该细胞的后代或潜在的后代。因为由于突变或环境影响导致某些改变可以在后代中发生,该后代事实上可以与母细胞不相同,但仍被包括在本文所用术语的范围内。
“异源嵌合体”,“同源嵌合体”,“嵌合的哺乳动物”等是指转基因哺乳动物,其在至少一些它的含有基因组的细胞中具有剔除或敲入(knock-in)构建体。
术语“对照”或“对照样品”是指对于所用检测技术适合的任何样品。对照样品可以包含所用等位基因检测技术的产物或待检测的材料。另外,对照可以是阳性或阴性对照。通过实施例的方式,其中等位基因检测技术是PCR扩增,接着大小分级,对照样品可以包含适当大小的DNA片段。同样,当等位基因检测技术涉及检测突变蛋白质时,对照样品可以包含突变蛋白质的样品。然而,优选对照样品包含待检测的物质。例如,对照可以是基因组DNA样品或IL-1基因簇的克隆部分。然而,当待检测的样品是基因组DNA时,优选对照样品是高度纯化的基因组DNA样品。
短语“与IL-1多态性有关的疾病和症状”是指多种疾病或症状,基于IL-1复合体内的一个或多个等位基因的鉴定可以显示在受试者中对其的易感性。实例包括炎性或退行性疾病,包括系统性炎症反应(SIRS);阿尔茨海默氏病(和相关的病症和症状包括慢性神经炎症,神经胶质激活;增加的小神经胶质细胞;神经炎斑块形成;和对治疗的应答);肌萎缩性侧索硬化症(Amylotropic Lateral Sclerosis)(ALS),关节炎(和相关的病症和症状,包括急性关节炎,抗原诱导的关节炎,与慢性淋巴细胞性甲状腺炎有关的关节炎,胶原诱导的关节炎,幼年性慢性关节炎;幼年性类风湿关节炎,骨关节炎,预后(prognosis)和链球菌诱导的关节炎),哮喘(和相关病症和症状,包括支气管哮喘;慢性阻塞性气道疾病,慢性阻塞性肺疾病,幼年性哮喘和职业性哮喘);心血管疾病(和相关病症和症状,包括动脉粥样硬化;自身免疫性心肌炎,慢性心脏缺氧,充血性心力衰竭,冠状动脉病,心肌病和心细胞功能障碍,包括主动脉平滑肌细胞激活;心细胞编程性细胞死亡;和心细胞功能的免疫调节;糖尿病和相关病症和症状,包括自身免疫性糖尿病,胰岛素依赖性(1型)糖尿病,糖尿病牙周炎,糖尿病视网膜病,和糖尿病肾病);肠胃炎症(和相关病症和症状,包括乳糜泻(celiac disease),相关的骨质稀少,慢性结肠炎,局限性回肠炎,炎性肠病和溃疡性结肠炎);胃溃疡;肝炎症,胆固醇胆石和肝纤维化,HIV感染(和相关病症和症状,包括退行性应答,神经变性应答,和HIV有关的霍奇森病),川崎综合征(和相关病症和症状,包括粘膜皮肤淋巴结综合征,子宫颈淋巴结病,冠状动脉损伤,浮肿,发热,增加的白细胞,轻度贫血,脱皮,皮疹,结膜发红,血小板增多;多发性硬化,肾病(和相关疾病和病症,包括糖尿病肾病,晚期肾病,肾小球性肾炎,古德帕斯彻综合症,血液透析存活和肾局部缺血再灌注损伤),神经变性病(和相关疾病和症状,包括急性神经变性,衰老和神经变性病中IL-1的诱导,IL-1诱导的下丘脑神经元的可塑性和慢性应激过度反应性),眼病(Qphthalmopathies)(和相关疾病和病症,包括糖尿病视网膜病,格雷夫斯眼病,和葡萄膜炎,骨质疏松症(和相关疾病和病症,包括牙糟,股骨,桡骨,椎骨或腕骨损失或骨折发生,经绝后的骨损失,物质(mass),骨折发生或骨损失速率),中耳炎(成人或儿科),胰腺炎或胰腺泡炎,牙周病(和相关疾病和病症,包括成人,早发性和糖尿病性);肺病,包括慢性肺病,慢性窦炎,透明膜病,缺氧和SIDS中的肺病;再狭窄;风湿病,包括类风湿性关节炎,风湿病阿孝夫小体,风湿病和风湿性心肌炎;甲状腺炎,包括慢性淋巴细胞性甲状腺炎;尿道感染,包括慢性前列腺炎,慢性骨盆疼痛综合症和尿石病。免疫疾病,包括自身免疫病,如斑秃,自身免疫性心肌炎,格雷夫斯病,格雷夫斯眼病,苔藓硬化症,多发性硬化,牛皮癣,系统性红斑狼疮,系统性硬化,甲状腺病(例如甲状腺肿和基质淋巴瘤性(桥本甲状腺炎,淋巴结样甲状腺肿),睡眠障碍和慢性疲劳综合症和肥胖症(非糖尿病性或与糖尿病有关)。对传染病的抗性,所述传染病如利什曼病,麻风病,莱姆病,莱姆心炎,疟疾,脑型疟,脑膜炎,与疟疾有关的管状肠肾炎),其是由细菌,病毒(例如巨细胞病毒,脑炎,EB病毒,人免疫缺陷病毒,流感病毒)或原生动物(例如恶性疟原虫,锥虫)导致的。对包括脑外伤的外伤的应答,(包括中风和局部缺血,脑炎,脑病,癫痫,围生期脑损伤,持续热性癫痫发作,SIDS和蛛网膜下出血),低出生体重(例如大脑性麻痹),肺损伤(急性出血性肺损伤,古德帕斯彻综合症,急性局部缺血再灌注),心肌功能障碍,其是由职业和环境污染物导致(例如对毒油综合症硅病的易感性),辐射创伤,和伤口愈合反应的效率(例如烧伤或烫伤,慢性伤口,外科手术伤口和脊髓损伤)。对瘤形成的易感性,包括乳腺癌相关的溶骨转移瘤,恶病质,结直肠癌,过度增殖性疾病,霍奇森病,白血病,淋巴瘤,代谢病和肿瘤,转移瘤,骨髓瘤(myeolomas),和各种癌症(包括乳房,前列腺,卵巢,结肠,肺等),厌食症和恶病质。激素调节,包括生育力/生殖力,妊娠的可能性,早产发生率,产前和新生期并发症,包括早产低出生体重,大脑性麻痹,败血病,低甲状腺素症(hypothyroxinernia),氧依赖,颅畸形,绝经提前。受试者对移植物的反应(排斥或接受),急性期反应(例如发热反应),普通炎症发应,急性呼吸窘迫反应,急性系统性炎症反应,伤口愈合,粘连,免疫炎症反应,神经内分泌反应,发热发展和抵抗,急性期反应,应激反应,疾病易感性,重复运动应激,网球肘,和疼痛管理和反应。
术语“基因破坏”和“定向破坏”或任何类似的短语是指位点特异性的破坏天然DNA序列以便与野生型拷贝的该基因相比防止在细胞中该基因的表达。间断可以由对基因的缺失,插入或修饰或其任何组合所导致。
本文所用的术语“单倍型”意欲是指一组等位基因,其在统计学有意义的水平上(pcorr<0.05)作为一组(连锁不平衡)一起遗传。如本文所用,短语“IL-1单倍型”是指IL-1基因座中的单倍型。IL-1炎性或促炎单倍型是指表示增加的激动剂和/或降低的拮抗物活性的单倍型。
本文所用的术语“IL-1基因簇”和“IL-1基因座”包括位于或接近染色体2的2q13区域的所有核酸,包括至少IL-1A,IL-1B和IL-1RN基因和其它任何连锁序列。(Nicklin等,Genomics 19382-84,1994)。本文所用的术语“IL-1A”,“IL-1B”,和“IL-1RN”分别是指编码IL-1,IL-1和IL-1受体拮抗物的基因。IL-1A,IL-1B,和IL-1RN的基因登记号分别为X03833,X04500,和X64532。
“IL-1功能突变”是指lL-1基因簇内导致改变的表型的突变(即影响IL-1基因或蛋白质的功能)。实例包括IL-1A(+4845)等位基因2,IL-1B(+3954)等位基因2,IL-1B(+6912)等位基因2和IL-1RN(+2018)等位基因2。
“IL-1X(Z)等位基因Y”是指特定的等位基因型,称为Y,其出现在基因X的IL-1基因座多态位点,其中X是IL-1A,B或RN并且位于或接近核苷酸Z,其中核苷酸Z是相对于主要转录起始位点编号,其是特定IL-1基因X的核苷酸+1。如本文另外所用,4179X术语“IL-1X等位基因(Z)”是指位于或接近核苷酸Z的基因X中IL-1多态位点的所有等位基因。例如,术语“IL-1RN(+2018)等位基因”是指在标记+2018处IL-1RN基因的备选型。“IL-1RN(+2018)等位基因1”是指IL-1RN基因型,其在有义链的位置+2018包含半胱氨酸(C)。Clay等,Hum.Genet.97723-26,1996。“IL-1RN(+2018)等位基因2”是指IL-1RN基因形式,其在正链的位置+2018含有胸腺嘧啶(T)。当受试者具有两个相同的IL-1RN等位基因时,受试者被称为纯合的,或具有纯合状态。当受试者具有两个不同IL-1RN等位基因时,受试者被称为杂合的,或具有杂合状态。术语“IL-1RN(+2018)等位基因2,2”是指纯合IL-1RN(+2018)等位基因2状态。相反,术语“IL-1RN(+2018)等位基因1,1”是指纯合IL-1RN(+2018)等位基因1状态。术语“IL-1RN(+2018)等位基因1,2”是指杂合等位基因1和2状态。
术语“IL-1表型”含义是指由IL-1基因座位的遗传同一性导致的任何表型-即包括对炎性疾病或症状的增加或降低的倾向以及“正常的”(例如平均或“野生型”)相关的炎性疾病或病症的可能性。
本文所用的“IL-1相关”意欲包括在人染色体2(2q 12-14)上所有与人IL-1基因座基因有关的基因。这些包括位于染色体2(2q 13-14)的人IL-1基因簇的IL-1基因,包括编码白细胞介素-1α的IL-1A基因,编码白细胞介素-1β的IL-1B基因,和编码白细胞介素-1受体拮抗物的IL-1RN(或IL-1ra)基因。另外这些IL-1相关基因包括位于人染色体2(2q12)的I型和II型人IL-1受体基因和位于小鼠染色体1位置19.5cM的它们的小鼠同系物。白细胞介素-1α,白细胞介素-1β,和白细胞介素-1RN如此相关以致它们都与IL-1I型受体结合,然而仅白细胞介素-1α和白细胞介素-1β是激活IL-1I型受体的激动剂配体,而白细胞介素-1RN是天然存在的拮抗物配体。当将术语“IL-1”用于参考基因产物或多肽时,意欲是指由人染色体2(2q 12-14)上的白细胞介素-1基因座所编码的所有基因产物和来自其它物种的它们对应的同系物或其功能变体。术语IL-1因此包括促进炎症应答的分泌的多肽,如IL-1α和IL-1β,以及拮抗炎症应答的分泌的多肽,如IL-1受体拮抗物和IL-1II型(引诱)受体。
“IL-1受体”或“IL-1R”是指结合各种细胞膜的蛋白质受体,其能够结合和/或转导来自IL-1基因座编码的配体的信号。术语适用于任何能够结合白细胞介素-1(IL-1)分子的蛋白质,所述蛋白质为它们的天然构型作为哺乳动物质膜蛋白,可能在将IL-1提供的信号转导给细胞中起作用。如本文所用,术语包括具有IL-1结合或信号转导活性的天然蛋白质的类似物。实例包括在美国专利4,968,607中描述的人和鼠IL-1受体。术语“IL-1核酸”是指编码IL-1蛋白质的核酸。
“IL-1多肽”和“IL-1蛋白质”意欲包括包含由图1,2,和3中显示的IL-1基因组DNA序列编码的氨基酸序列的多肽,或其片段和其同系物,并且包括激动剂和拮抗物多肽。
“增加的风险”是指与未携带特定多态等位基因的群体成员中疾病或病症发生频率相比,在携带特定多态等位基因的个体中统计学上更高的疾病或病症发生频率。
“降低的风险”是指与未携带特定多态等位基因的群体成员中或在整个群体中疾病或病症发生频率相比,在携带特定多态等位基因的个体中统计学上更低的疾病或病症发生频率。
本文所用的术语“相互作用”意欲包括分子间可检测的关系或关联(例如生化相互作用),如本质上蛋白质-蛋白质,蛋白质-核酸,核酸-核酸和蛋白质-小分子或核酸-小分子之间的相互作用。
本文关于核酸如DNA或RNA所用的术语“分离的”是指分别从在大分子天然来源中存在的其它DNA,或RNA分离的分子。例如,编码受试者IL-1多肽之一的分离的核酸优选包括不超过10千碱基(kb)的天然紧邻基因组DNA中IL-1基因的核酸序列,更优选不超过5kb这种天然存在的侧翼序列,最优选小于1.5kb的这种天然存在的侧翼序列。本文所用的术语分离还指基本上不含细胞物质,病毒物质,或当通过重组DNA技术生产时培养基,或当化学合成时的化学前体或其它化学物质的核酸或肽。此外,“分离的核酸”意欲包括天然不是作为片段存在和在自然状态未发现的核酸片段。术语“分离的”在本文中还用于指从其它细胞蛋白质分离的多肽,并且意欲包括纯化和重组的多肽。
“敲入(knock-in)”转基因动物是指已经将修饰基因导入其基因组的动物,并且修饰基因可以是外源或内源性的。
“剔除”转基因动物是指其中存在对内源基因表达的部分或完全抑制的动物(例如基于缺失至少基因的一部分,用第二种序列替换至少基因的一部分,引入终止密码子,编码关键氨基酸的碱基的突变,或内含子接点的去除等)。
“剔除构建体”是指可以用于降低或抑制细胞中由内源DNA序列编码的蛋白质的表达的核酸序列。在简单实施例中,剔除构建体由基因,如IL-1RN基因组成,基因的关键部分有缺失,以便活性蛋白不能从中表达。备选地,可以将许多终止密码子加至天然基因以导致蛋白质的提前终止或可以使内含子接点失活。在典型的剔除构建体中,用可选择的标记(如neo基因)替换基因的某些部分因此基因可以如下表示IL-1RN 5’/neo/IL-1RN3’,其中IL-1RN 5’和IL-1RN 3’是指基因组或cDNA序列,其分别在相对于部分IL-1RN基因的上游和下游,并且其中neo是指新霉素抗性基因。在另一剔除构建体中,将第二种可选择的标记加入侧翼位置因此基因可以表示为IL-1RN/neo/IL-1RN/TK,其中TK是胸苷激酶基因,其可以加至前述构建体的IL-1RN5’或IL-1RN3’序列并且可以另外相对在适当培养基中选择(即是阴性可选择标记)。该双标记构建体允许从典型地保留TK序列的非同源重组事件中选择去除侧翼TK标记的同源重组事件。基因缺失和/或替换可以从外显子,内含子,特别是内含子接点,和/或调节区域如启动子进行。
“连锁不平衡”是指两个等位基因以大于从给定对照群体中每个等位基因发生的分开频率所期望的频率的共遗传。独立遗传的两个等位基因发生的期望频率是第一个等位基因的频率乘以第二个等位基因的频率。以期望频率共发生的等位基因称为“连锁不平衡”。连锁不平衡的原因经常是不清楚的。它可以是由于对特定等位基因组合的选择或遗传异种群体的最近混合。另外,在标记与疾病基因非常紧密连锁的情形中,如果疾病突变在最近过去发生以致还未经过足够的时间以通过特定染色体区域的重组事件达到平衡,期望等位基因(或一组连锁等位基因)与疾病基因的关联。当提及由多于一个等位基因组成的等位基因型时,如果所有包含第一个等位基因型的等位基因与第二个等位基因型的至少一个等位基因连锁不平衡,则第一个等位基因型与第二个等位基因型连锁不平衡。连锁不平衡的实例是在IL-1RN(+2018)和IL-1RN(VNTR)多态位点的等位基因之间发生。IL-1RN(+2018)的两个等位基因与IL-1RN(VNTR)的两个最频繁的等位基因,等位基因1和等位基因2是100%连锁不平衡。
术语“标记”是指已知在个体之间变化的基因组序列。例如,IL-1RN基因具有由可变数量的串联重复(VNTR)组成的标记。
“突变基因”或“突变”或“功能突变”是指基因的等位基因型,相对于不具有突变基因的受试者,其能够改变具有突变基因的受试者的表型。通过某些试剂可以校正或补偿由突变导致的改变的表型。如果对于该突变受试者必须是纯合的以具有改变的表型,则突变称为隐性的。如果一个拷贝的突变基因足以改变受试者的表型,则突变称为显性的。如果受试者具有一个拷贝的突变基因和具有纯合和杂合受试者之间的表型(对于该基因),突变称为共显性的。
本发明的“非人类动物”包括哺乳动物如啮齿类,非人灵长类,羊,狗,牛,山羊,等,两栖类,如非洲爪蟾属成员,和转基因鸟类(例如鸡,鸟等)。术语“嵌合动物”在本文中用来指其中发现重组基因,或者其中重组基因在动物的一些但不是全部细胞中表达的动物。术语“组织特异性嵌合动物”表示重组IL-1基因之一在一些组织但不在其它组织中存在和/或表达或破坏。术语“非人类哺乳动物”是指哺乳动物纲除了人类以外的任何成员。
如本文所用,术语“核酸”是指多核苷酸或寡核苷酸如脱氧核糖核酸(DNA),并且当适当时,指核糖核酸(RNA)。术语应当也被理解为包括,作为等价物,由核苷酸类似物制成的RNA或DNA的类似物(例如肽核酸)和如适用于描述的实施方案,单(有义或反义)和双链多核苷酸。
术语“营养物(nutraceutical)”如本文所用包括食品和饮食添加剂的FDA定义,其可以在治疗疾病或症状-特别是与炎性疾病有关的疾病或症状中有价值。因此,“营养物”包括可以用于获得健康益处的营养成分。这些成分可以是在“食品”-即“功能食品”中或在饮食添加剂中。在1994年10月,饮食添加剂健康和教育法案(Dietary Supplement Health andEducation Act)(“DSHEA”)被签署为法律。DSHEA认为数百万的消费者认为饮食添加剂可以提供健康益处。议会通过它的意图在于在消费者获得饮食添加剂和FDA当局反对存在安全问题或携带假的或误导标签的添加剂之间权衡轻重。DSHEA为饮食添加剂的安全性和标签建立了新的规章制度。FDA有义务以实现DSHEA的方式执行DSHEA。因此,本文所用的“营养物”包括本领域已知的饮食添加剂(例如微生素,矿物质,药草和其它添加剂),其被消化和意欲补充营养,包括“营养成分”。营养成分可以包括维生素,矿物质,药草或其它药材,氨基酸,和营养物质如酶。营养成分还可以是代谢物,组分,提取物,浓缩物,或这些成分的组合。营养物添加剂以包括片,胶囊,液体和棒的形式提供。
术语“多态性”是指基因或其部分(例如等位基因变体)多于一种形式的共存。存在至少两种不同形式,即两种不同核苷酸序列的基因的一部分被称为“基因的多态区域”。基因多态区域的特异基因序列是等位基因。多态区域可以是单核苷酸,其同一性在不同等位基因中不同。多态区域也可以是几个核苷酸长。
术语“对疾病的倾向”,和对疾病的“倾向”或“易感性”或任何相似的短语含义是某些等位基因因此被发现有关于或预示受试者发展特定疾病(例如血管病)的发生率。与健康个体相比,等位基因因此在患病个体中经常过度表达。因此,这些等位基因可以用来预测疾病,甚至在症状前或患病前的个体中预测疾病。
本文所用的“小分子”含义是指组合物,其具有小于约5kD和最优选小于约4kD的分子量。小分子可以是核酸,肽,肽模拟物,碳水化合物,脂质或其它有机或无机分子。
如本文所用,术语“特异性杂交”或“特异性检测”是指核酸分子与样品核酸的至少约6个连续核苷酸杂交的能力。
“转录调节序列”是贯穿本说明书使用的通称,是指DNA序列,如起始信号,增强子,和启动子,其诱导或控制它们可操作连接的蛋白质编码序列的转录。
如本文所用,术语“转基因”是指已经导入细胞的核酸序列(编码例如一种IL-1多肽,或向其的反义转录物)。转基因可以对于导入其的转基因动物或细胞部分或完全异源,即外源,或对于导入其的转基因动物或细胞的内源基因同源,但其被设计来以改变插入其的细胞基因组的方式被插入,或插入到动物基因组中(例如将它在不同于天然基因的位点插入或者它的插入导致剔除)。转基因还可以以附加体的形式存在于细胞中。转基因可以包括一个或多个转录调节序列和其它任何核酸,如内含子,其可能对于所选核酸的最佳表达是所需的。
“转基因动物”是指任何动物,优选非人类哺乳动物,鸟或两栖动物,其中一个或多个动物细胞包含通过人干预的方式如本领域公知的转基因技术引入的异源核酸。经过计划的遗传操作,如通过用重组病毒显微注射或通过注射,通过导入细胞前体将核酸直接或间接导入细胞。术语遗传操作不包括常规的杂交育种,或体外受精,而涉及重组DNA分子的引入。该分子可以整合到基因组中,或可以是染色体外复制的DNA。在本文所述的典型转基因动物中,转基因导致细胞表达IL-1多肽之一的重组形式,例如激动剂或拮抗物形式。然而,还考虑其中重组基因是沉默的转基因动物,例如以下描述的FLP或CRE重组酶依赖性构建体。此外,“转基因动物”还包括其中一个或多个基因的基因破坏是由人干预导致的那些重组动物,所述人干预包括重组和反义技术。术语意欲包括所有后代。因此,包括起始动物及其所有的F1,F2,F3等后代。
本文所用的术语“治疗”意欲包括治愈以及改善病症或疾病的至少一种症状。
术语“载体”是指核酸分子,其能够运输已经与它连接的另一核酸。一类优选载体是附加体,即能够在染色体外复制的核酸。优选载体是能够自主复制和/或表达与它们连接的核酸的那些。能够指导与它们可操作连接的基因表达的载体在此处被称为“表达载体”。通常,用于重组DNA技术的表达载体经常是“质粒”形式,其通常是指环状双链DNA环,它们的载体形式与染色体不结合。在本说明书中,“质粒”和“载体”可以交换使用,因为质粒是最常用的载体形式。然而,本发明随后于此意欲包括这种其它形式的表达载体,其起相当的作用并为本领域所知。
术语“野生型等位基因”是指基因的等位基因,当以两个拷贝存在受试者中时其导致野生型表型。因为基因中的某些核苷酸变化可能不影响具有两个拷贝具有核苷酸变化的基因的受试者的表型,可以存在特定基因的多个不同野生型等位基因。
4.3等位基因的检测许多方法可供检测人多态基因座的特定等位基因。用于检测特定多态等位基因的优选方法将部分依赖于多态性的分子性质。例如,多态基因座的不同等位基因形式可以通过DNA单碱基对区别。这种单核苷酸多态性(或SNP)是遗传变异的主要贡献者,包含约80%的所有已知多态性,它们在人类基因组中的密度估计为平均每1,000个碱基对1个。SNP是最频繁的二等位基因-仅以两种不同形式存在(尽管高达四种不同形式的SNP,对应于在DNA中出现的四种不同核苷酸碱基,在理论上是可能的)。然而,SNP在突变上比其它多态性更稳定,使它们适合于关联研究,其中将标记和未知变体之间的连锁不平衡用于将致病突变作图。另外,因为SNP典型地仅具有两种等位基因,它们可以通过简单的正/负测定而不是长度测量来基因分型,使它们更易于自动化。
多种方法可供检测个体中特定单核苷酸多态等位基因的存在。该领域的进展已经提供准确,容易和便宜的大规模SNP基因分型。最近,例如已经描述几种新技术,包括动态等位基因特异性杂交(DASH),微板阵列对角凝胶电泳(MADGE),焦磷酸测序(pyrosequencing),寡核苷酸特异性连接,TaqMan系统以及各种DNA“芯片”技术如Affymetrix SNP芯片。这些方法要求靶基因区域典型地通过PCR的扩增。还有其它新开发的方法,其基于通过侵入裂解产生小信号分子,接着质谱分析或固定化锁定探针和滚环扩增,最终可能消除PCR的需要。如下总结本领域已知的用于检测特定单核苷酸多态性的几种方法。本发明的方法应当理解为包括所有可利用的方法。
已经开发几种方法以促进单核苷酸多态性的分析。在一个实施方案中,通过使用专门的抗外切核酸酶的核苷酸可以检测单碱基多态性,如例如Mundy,C.R.(美国专利4,656,127)所公开。根据该方法,与紧接多态位点3’的等位基因序列互补的引物允许与从特定动物或人获得的靶分子杂交。如果在靶分子上的多态位点包含与存在的特定抗外切核酸酶的核苷酸衍生物互补的核苷酸,那么该衍生物将被掺入到杂交引物的末端。该掺入导致引物抗外切核酸酶,由此允许它的检测。因为样品抗外切核酸酶的衍生物的身份是已知的,引物已经变得抗外切核酸酶的发现显示存在靶分子的多态位点中的核苷酸与用于反应中的核苷酸衍生物互补。该方法具有优势即它不要求测定大量的外来序列数据。
在本发明的另一实施方案中,基于溶液的方法被用于测定多态位点核苷酸的同一性。Cohen,D.等(法国专利2,650,840;PCT申请No.WO91/02087)。如在美国专利4,656,127的Mundy方法中,使用与紧接多态位点3’的等位基因序列互补的引物。使用标记的双脱氧核苷酸衍生物,该方法确定那个位点的核苷酸的同一性,所述双脱氧核苷酸衍生物如果与多态位点的核苷酸互补将变得掺入引物的末端。
Goelet,P.等(PCT申请92/15712)描述一种备选方法,称为遗传位分析法(Genetic BitAnalysis)或GBA.TM。Goelet,P.等的方法使用标记的终止子和引物的混合物,所述引物与多态位点3’的序列互补。掺入的标记的终止子因此通过存在于被评估的靶分子的多态位点中的核苷酸而测定并与其互补。与Cohen等的方法(法国专利2,650,840;PCT申请No.WO91/02087)形成对比,Goelet,P.等的方法优选是不均匀相测定,其中将引物或靶分子固定于固相。
近来,已经描述几种用于测定DNA中多态位点的引物引导的核苷酸掺入方法(Komher,J.S.等,Nucl.Acids.Res.177779-7784(1989);Sokolov,B.P.,Nucl.Acids Res.183671(1990);Syvanen,A.-C.,等,Genomics 8684-692(1990);Kuppuswamy,M.N.等,Proc.Natl.Acad.Sci.(U.S.A.)881143-1147(1991);Prezant,T.R.等,Hum.Mutat.1159-164(1992);Ugozzoli,L.等,GATA 9107-112(1992);Nyren,P.等,Anal.Biochem.208171-175(1993))。这些方法区别于GBA.TM,在于它们全部依赖于标记的脱氧核苷酸的掺入以在多态位点处的碱基之间区别。在该形式中,因为信号与掺入的脱氧核苷酸的数量成比例,在相同核苷酸的运行中出现的多态性可以产生与运行长度成比例的信号(Syvanen,A.-C.,等,Amer.J.Hum.Genet.5246-59(1993))。
对于导致蛋白质翻译的过早终止的突变,蛋白质截短试验(PTT)提供有效的诊断方法(Roest,等,(1993)Hum.Mol. Genet.21719-21;van derLuijt,等,(1994)Genomics 201-4)。对于PTT,RNA最初从可利用的组织中分离并被逆转录,通过PCR扩增目的区段。然后将逆转录PCR的产物用作嵌套PCR扩增的模板,引物包含RNA聚合酶启动子和用于起始真核生物翻译的序列。在扩增目的区域以后,掺入到引物的独特基序允许PCR产物的连续体外转录和翻译。经过翻译产物的十二烷基硫酸钠-聚丙烯酰胺凝胶电泳以后,截短多肽的出现指示导致翻译过早终止的突变的存在。在该技术的变体中,当目的靶区域来源于单个外显子时,将DNA(与RNA相反)用作PCR模板。
可以利用任何细胞类型或组织以获得用于本文所述诊断的核酸样品。在优选实施方案中,DNA样品获自体液,例如通过已知技术(例如静脉穿刺)获得的血液或唾液。备选地,可以在干燥样品(例如头发或皮肤)上进行核酸检验。当使用RNA或蛋白质时,可以使用的细胞或组织必须表达IL-1基因。
还可以直接在获自活组织检查或切除术的受试者组织的组织切片(固定和/或冷冻)上原位进行诊断步骤,因此不需要核酸纯化。可以将核酸试剂用作该原位方法的探针和/或引物(参见例如,Nuovo,G.J.,1992,PCR insitu hybridizationprotocols and applications,Raven Press,NY)。
除了主要集中在检测一个核酸序列的方法以外,在该检测方案中还可以评估图谱。例如通过使用差异显示方法,Northern分析和/或RT-PCR可以产生指纹图谱。
优选的检测方法是使用探针的等位基因特异性杂交,所述探针重叠IL-1促炎单倍型的至少一个等位基因区域和具有突变或多态区域周围约5,10,20,25,或30个核苷酸。在本发明的优选实施方案中,将能够与其它涉及再狭窄的等位基因变体特异性杂交的几个探针附着在固相载体,例如“芯片”(其可以容纳高达约250,000个寡核苷酸)。寡核苷酸可以通过包括平版印刷术的多种方法与固相载体结合。例如在Cronin等(1996)Human Mutation 7244中描述使用这些包含寡核苷酸的芯片,也称为“DNA探针阵列”的突变检测分析。在一个实施方案中,芯片包含基因的至少一个多态区域的所有等位基因变体。然后将固相载体与检验核酸接触并检测与特异性探针的杂交。因此,在简单的杂交实验中可以鉴定一个或多个基因的许多等位基因变体的同一性。
这些技术可以还包含在分析前扩增核酸的步骤。扩增技术对于本领域技术人员是已知的,并包括但不限于克隆,聚合酶链式反应(PCR),特异性等位基因的聚合酶链式反应(ASA),连接酶链式反应(LCR),嵌套聚合酶链式反应,自动维持序列扩增(Guatelli,J.C.等,1990,Proc.Natl.Acad.Sci.USA 871874-1878),转录扩增系统(Kwoh,D.Y.等,1989,Proc.Natl.Acad.Sci.USA 861173-1177),和Q-Beta复制酶(Lizardi,P.M.等,1988,Bio/Technology 61197)。
扩增产物可以以多种方式测定,包括大小分析,限制消化接着大小分析,在反应产物中检测特异性标记的寡核苷酸引物,等位基因特异性寡核苷酸(ASO)杂交,等位基因特异性5’外切核酸酶检测,测序,杂交等。
基于PCR的检测方法可以同时包括多重扩增多个标记。例如,在本领域中公知选择PCR引物以产生大小不重叠并且可以同时分析的PCR产物。备选地,可以用区别标记和因此每个可以区别检测的引物扩增不同标记。当然,基于杂交的检测方法允许样品中多个PCR产物的差异检测。本领域已知其它技术允许多个标记的多重分析。
在仅仅说明性的实施方案中,方法包括以下步骤(i)从患者收集细胞样品,(ii)从样品细胞中分离核酸(例如,基因组,mRNA或两者),(iii)在各种条件下将核酸样品与一个或多个引物接触以便发生等位基因的杂交和扩增,所述引物与IL-1促炎单倍型的至少一个等位基因5’和3’特异性杂交,和(iv)检测扩增产物。如果这些分子以极低数量存在,这些检测方案对于检测核酸分子特别有用。
在受试者测定的优选实施方案中,通过限制酶切割图谱的改变鉴定IL-1促炎单倍型的等位基因。例如,分离样品和对照DNA,扩增(任选地),用一种或多种限制内切核酸酶消化,通过凝胶电泳确定片段长度大小。
在还有另一实施方案中,本领域已知的多种测序反应中的任何一种可以用于直接将等位基因测序。示例性的测序反应包括基于由Maxim和Gilbert((1977)Proc.Natl Acad Sci USA 74560)或Sanger(Sanger等(1977)Proc.Nat.Acad.Sci USA 745463)开发的技术的那些。还考虑当进行受试者测定时可以使用多种自动测序方法中的任何一种(参见例如Biotechniques(1995)19448),包括通过质谱测序(参见例如PCT公开WO94/16101;Cohen等(1996)Adv Chromatogr 36127-162;和Griffin等(1993)Appl Biochem Biotechnol 38147-159)。对于本领域技术人员将明显的是,对于某些实施方案,仅仅需要在测序反应中确定一个,两个或三个核酸碱基的出现。例如,可以进行A-跟踪(track)等,如其中仅检测一个核酸。
在另一实施方案中,可以使用防止切割剂(如核酸酶,羟胺或四氧化锇和哌啶)的保护来检测RNA/RNA或RNA/DNA或DNA/DNA异源双链中的错配碱基(Myers,等(1985)Science 2301242)。通常,“错配切割”的现有技术通过提供通过将含有野生型等位基因的(标记的)RNA或DNA与样品杂交形成的异源双链起始。用试剂处理双链体,该试剂切割双链体的单链区域,如由于对照和样品链之间的碱基对错配导致其将存在。例如,可以用RNA酶处理RNA/DNA双链体,用S1核酸酶处理DNA/DNA杂交物(hybrid)以酶促消化错配区域。在其它实施方案中,可以用羟胺或四氧化锇和哌啶处理DNA/DNA或RNA/DNA双链体以便消化错配区域。在消化错配区域以后,然后通过在变性聚丙烯酰胺凝胶上通过大小分离得到的物质以确定突变位点。参见例如Cotton等(1988)Proc.NatlAcad Sci USA854397;和Saleeba等(1992)Methods Enzymol.217286-295。在优选实施方案中,可以将对照DNA或RNA标记以用于检测。
在还有另一实施方案中,错配切割反应使用一种或多种识别双链DNA中的错配碱基对的蛋白质(所谓“DNA错配修复”酶)。例如大肠杆菌mutY酶在G/A错配处切割A,来自HeLa细胞的胸苷DNA糖基化酶在G/T错配处切割T(Hsu等(1994)Carcinogenesis 151657-1662)。按照例举的实施方案,基于IL-1基因座单倍型的等位基因的探针与来自检验细胞的cDNA或其它DNA产物杂交。用DNA错配修复酶处理双链体,从电泳方案等可以检测切割产物,如果有的话。参见例如美国专利5,459,039。
在其它实施方案中,电泳迁移率的改变将可以用来鉴定IL-1基因座等位基因。例如,单链构象多态性(SSCP)可以用于检测突变型和野生型核酸之间的电泳迁移率的差异(Orita等(1989)Proc Natl.Acad.Sci USA 862766,还参见Cotton(1993)Mutat Res 285125-144;和Hayashi(1992)Genet Anal Tech Appl 973-79)。将样品和对照IL-1基因座等位基因的单链DNA片段变性并允许复性。单链核酸的二级结构根据序列而变化,导致的电泳迁移率的改变使能够检测甚至单一的碱基变化。可以将DNA片段标记或用标记探针检测。通过使用RNA(而不是DNA)可以增强测定的灵敏性,在RNA中二级结构对序列变化更敏感。在优选实施方案中,基于电泳迁移率的变化,主题方法使用异源双链体分析来分离双链异源双链分子(Keen等(1991)Trends Genet 75)。
在还有另一实施方案中,使用变性梯度凝胶电泳(DGGE)测定在含有梯度变性剂的聚丙烯酰胺凝胶中等位基因的运动(Myers等(1985)Nature313495)。当将DGGE用作分析方法时,例如通过PCR加入约40bp高-熔解富含GC的DNA的GC夹(clamp)修饰DNA以确保它不完全变性。在另一实施方案中,使用温度梯度替代变性剂梯度来鉴定对照和样品DNA的迁移率差异(Rosenbaum和Reissner(1987)Biophys Chem 26512753)。
其它用于检测等位基因的技术的实例包括但不限于,选择性寡核苷酸杂交,选择性扩增,或选择性引物延伸。例如,可以制备其中已知突变或核苷酸差异(例如在等位基因变体中)被放置在中央的寡核苷酸引物,然后在只有当发现完全匹配时允许杂交的条件下与靶DNA杂交(Saiki等(1986)Nature 324163);Saiki等(1989)Proc.Natl Acad.Sci USA 866230)。当寡核苷酸与PCR扩增的靶DNA杂交时该等位基因特异性寡核苷酸杂交技术可以用于检测每个反应一个突变或多态区域,当寡核苷酸附着在杂交膜和与标记的靶DNA杂交时该技术可以用于检测许多不同突变或多态区域。
备选地,依赖于选择性PCR扩增的等位基因特异性扩增技术可以与本发明结合使用。用作特异性扩增的引物的寡核苷酸可以在分子中央携带所关心的突变或多态区域(因此扩增取决于示差杂交)(Gibbs等(1989)Nucleic Acids Res.172437-2448),或者在一条引物的最3’末端,其中在适当条件下可以防止错配,或减少聚合酶延伸(Prossner(1993)Tibtech 11238)。另外,可以期望在突变区域引入新的限制位点以产生基于切割的检测(Gasparini等(1992)Mol.Cell Probes 61)。预期在某些实施方案还可以使用用于扩增的Taq连接酶来进行扩增(Barany(1991)Proc.Natl.Acad.Sci USA 88189)。在这些情形中,只有当5’序列的3’末端存在完全匹配时发生连接,使可以通过检查扩增的存在或缺乏来检测在特定位点已知突变的存在。
在另一实施方案中,如例如U.S.专利4,998,617和在Landegren,U.等((1988)Science 2411077-1080)所述,使用寡核苷酸连接测定(OLA)进行等位基因变体的鉴定。OLA方案使用两条寡核苷酸,其设计来能够与靶单链的邻接序列杂交。寡核苷酸之一与分离标记连接,例如生物素化,另一条可检测地标记。如果在靶分子中发现精确的互补序列,寡核苷酸将杂交以致它们的末端邻接,并产生连接底物。然后连接允许使用抗生物素蛋白或另外的生物素配体回收标记的寡核苷酸。Nickerson,D.A.等已经描述结合PCR和OLA属性的核酸检测分析(Nickerson,D.A.等(1990)Proc.Natl.Acad.Sci.USA 878923-27)。在该方法中,将PCR用于实现靶DNA的指数扩增,然后使用OLA检测。
已经开发几种基于该OLA方法的技术并可以用于检测IL-1基因座单倍型的等位基因。例如,美国专利5,593,826公开OLA,其使用具有3’-氨基的寡核苷酸和5’-磷酸化寡核苷酸以形成具有氨基磷酸酯连接的偶联物。在Tobe等((1996)Nucleic Acids Res 243728)描述的另一种OLA变体中,与PCR结合的OLA允许在单个微量滴定孔中将两个等位基因分型。通过用独特的半抗原,即羊地黄毒苷和荧光素标记每种等位基因特异性引物,通过使用半抗原特异性抗体可以检测每种OLA反应,所述半抗原特异性抗体用不同酶报告基因(reporter),碱性磷酸酶或辣根过氧化物酶标记。该系统允许使用导致两种不同颜色产生的高通量形式检测两个等位基因。
本发明另一实施方案涉及用于检测发展再狭窄的倾向的试剂盒。该试剂盒可包含一种或多种寡核苷酸,包括与IL-1基因座单倍型的至少一个等位基因5’和3’杂交的5’和3’寡核苷酸。PCR扩增寡核苷酸应当在相隔25和2500个碱基对之间,优选相隔约100和约500个碱基之间杂交,以便产生大小便于随后分析的PCR产物。
特别优选的引物包括在图8-11中描述的核苷酸序列。来自包含人IL-1基因座的人染色体2q13-的最新序列信息和最新的关于该基因座可获得的人多态性信息的可用性促进用于通过本发明方法扩增和检测IL-1多态等位基因的另外的寡核苷酸的设计。例如,分别在图1(GenBank登记号X03833),2(GenBank登记号X04500)和3(GenBank登记号X64532)中显示关于IL-1A,IL-1B和IL-1RN的DNA序列。使用该序列信息和本领域已知用于设计和优化引物序列的标准技术,可以容易地设计用于检测这些基因中人类多态性的适当引物。例如通过使用可商购的引物选择程序如Primer 2.1,Primer 3或GeneFisher可以完成这些引物序列的最优设计(还参见Nicklin M.H.J.,Weith A.Duff G.W.,“A Physical Map of theRegion Encompassing the Human Interleukin-1α,Interleukin-1β,andInterleukin-1Receptor Antagonist Genes”Genomics 19382(1995);Nothwang H.G,等“Molecular Cloning of the Interleukin-1 gene ClusterConstruction of an Integrated YAC/PAC Contig and a partial transcriptionalMap in the Region of Chromosome 2ql 3”Genomics 41370(1997);Clark,等(1986)Nucl.Acids.Res.,147897-7914[出版错误在Nucleic Acids Res.,15868(1987)和URL http//www.gdb.org的Genome Database(GDB)计划中出现]。
关于试剂盒中的使用,寡核苷酸可以是多种天然和/或合成组合物中的任何一种,如合成寡核苷酸,限制片段,cDNA,合成肽核酸(PNA),等。分析试剂盒和方法还可以使用标记的寡核苷酸以允许在测定中易于鉴定。可以使用的标记的实例包括放射标记,酶,荧光化合物,链霉抗生物素,抗生物素蛋白,生物素,磁性部分,金属结合部分,抗原或抗体部分等。
试剂盒可以任选地还包括DNA取样装置。DNA取样装置对于本领域技术人员是公知的并且可以包括但不限于基质,如滤纸,AmpliCard.TM(University of Sheffield,Sheffield,England S10 2JF;Tarlow,JW,等,J.ofInvest.Dermatol.103387-389(1994))等;DNA纯化试剂如Nucleo.TM试剂盒,裂解缓冲液,蛋白酶溶液等;PCR试剂,如10x反应缓冲液,热稳定性聚合酶,dNTP等;和等位基因检测装置如HinfI限制酶,等位基因特异性寡核苷酸,用于从干血的嵌套PCR的简并寡核苷酸引物。
4.4药物基因组学(pharmacogenomics)单独或结合关于其它有助于特定疾病或病症的遗传缺陷的信息,了解与发展特定疾病或病症的敏感性相关的特定等位基因允许按照个体的遗传图谱定制化预防或治疗,这是“药物基因组学”的目标。因此,个体IL-1图谱与种群图谱关于血管疾病的比较,允许选择或设计药物或其它治疗方案,其期望对于特定患者或患者群体(即一组具有相同遗传改变的患者)是安全和有效的。
另外,基于遗传图谱靶向期望显示最高临床益处的群体的能力使可以1)重新定位已经上市的药物;2)拯救由于安全性或功效限制导致中断临床开发的患者亚群特异性的候选药物;和3)加速和更便宜地开发候选疗法和更优化的药物标签(例如因为测量各种剂量的药剂对致病突变的效果对于优化有效剂量是有用的)。
通过测定蛋白质(例如IL-1α,IL-1β,或IL-1Ra),mRNA和/或转录水平可以监测特定疗法的个体治疗。根据检测水平,然后可以维持或调整(增加或减少剂量)治疗方案。在优选实施方案中,用药剂治疗受试者的效力包含以下步骤(i)在给药药剂之前从受试者中获得给药前样品;(ii)检测给药前样品中的蛋白质,mRNA或基因组DNA的水平或数量;(iii)从受试者中获得一个或多个给药后的样品;(iv)在给药后的样品中检测蛋白质,mRNA或基因组DNA的表达水平或活性;(v)将在给药前的样品中蛋白质,mRNA或基因组DNA的表达水平或活性分别与在给药后的样品中对应的蛋白质,mRNA或基因组DNA比较;和(vi)相应地改变对受试者的药剂给药。
还可以在治疗剂给药之前和之后获得受试者的细胞以检测除了IL-1基因以外的基因的表达水平,以证实治疗剂未增加或减少可能有害的基因的表达。这可以例如通过使用转录作图(profiling)的方法完成。因此,可以将来自体内暴露于治疗剂的细胞的mRNA和来自未暴露于治疗剂的相同类型细胞的mRNA逆转录和与含有来自多个基因的DNA的芯片杂交,由此比较在用治疗剂处理或未处理的细胞中基因的表达。
4.5.用于与IL-1多态性有关的疾病和病症的治疗剂用于与IL-1多态性或单倍型有关的疾病和病症的治疗剂是指防止或延迟受试者中特定疾病或症状的发展或缓解其症状的任何试剂或治疗方案(包括药物,营养物和外科方法)。治疗剂可以是多肽,肽模拟物,核酸或其它无机或有机分子,优选包括维生素,矿物质和其它养分的“小分子”。通过模仿或加强(激动)或抑制(拮抗)天然存在的多肽作用,优选治疗剂可以调节IL-1多肽的至少一种活性,例如与受体的相互作用。激动剂可以是野生型蛋白质或其具有至少一种野生型生物活性例如受体结合活性的衍生物。激动剂还可以是上调基因表达或者增加蛋白质的至少一种生物活性的化合物。激动剂还可以是增加多肽与另一分子例如受体相互作用的化合物。拮抗物可以是抑制或减少蛋白质和另一分子例如受体之间的相互作用的化合物,或者是阻断信号转导或翻译后加工的试剂(例如IL-1转化酶(ICE)抑制剂)。因此,优选的拮抗物是抑制或减少与受体结合和由此阻断随后受体激活的化合物。拮抗物还可以是下调基因表达或减少存在的蛋白质的量的化合物。拮抗物可以是显性失活形式(negative form)的多肽,例如能够与靶肽例如受体相互作用但是不促进受体激活的形式的多肽。拮抗物还可以是编码显性失活形式的多肽的核酸,反义核酸,或能够与RNA特异性相互作用的核酶。还有的其它拮抗物是与多肽结合和抑制其作用的分子。这些分子包括肽,例如不具有生物活性和抑制与受体结合的各种形式的靶肽。因此,这些肽将与蛋白质的活性位点结合和防止它与靶肽相互作用。还有的其它拮抗物包括与分子表位特异性相互作用,以致结合干涉多肽的生物学功能的抗体。在还有另一优选实施方案中,拮抗物是小分子,如能够抑制多肽和靶受体之间相互作用的分子。备选地,通过与除了受体结合位点以外的位点相互作用,小分子可以用作拮抗物。
IL-1(例如IL-1α,IL-1β或IL-1受体拮抗物)或由与IL-1基因连锁不平衡的基因编码的蛋白质的调节物可以包含任何类型的化合物,包括蛋白质,肽,肽模拟物(peptidomimetic),小分子,或核酸。优选的拮抗物包括核酸(例如编码IL-1蛋白或被IL-1蛋白上调或下调的基因),蛋白质(例如IL-蛋白质或由此上调或下调的蛋白质)或小分子(例如调节IL-1蛋白表达或结合)。例如使用本文所述的测定可以鉴定的优选拮抗物,包括核酸(例如单(反义)或双链(三链体)DNA或PNA和核酶),蛋白质(例如抗体)和用于制止或抑制IL-1转录和/或蛋白质活性的小分子。
4.6.有效剂量和制剂和应用通过在细胞培养物或实验动物中例如用于测定LD50(50%群体致死的剂量)和Ed50(50%群体治疗有效的剂量)的标准药物程序,可以测定这些化合物的毒性和治疗功效。有毒和治疗作用之间的剂量比率是治疗指数,它可以表达为比率LD50/ED50。优选显示大的治疗指数的化合物。尽管可以使用显示毒性副作用的化合物,应当小心设计传递系统,其将这些化合物靶向受影响组织的部位,以便最小化对未感染细胞的潜在损伤和由此减小副作用。
从细胞培养测定和动物研究获得的数据可以用于配制各种用于人类的剂量。这些化合物的剂量优选位于包括ED50具有很小或无毒性的循环浓度范围内。根据所用剂型和所用给药途径,剂量可以在该范围内变化。对于本发明方法中所用的任何化合物,最初从细胞培养测定中可以评估治疗有效剂量。在动物模型中可以配制剂量以获得包括如细胞培养中测定的IC50(即获得症状最大抑制一半的检测化合物的浓度)的循环血浆浓度范围。该信息可以用于更准确地测定人类中的有效剂量。例如通过高效液相色谱可以测量血浆中的水平。
可以使用一种或多种生理上可接受的载体或赋形剂以常规方法配制按照本发明使用的组合物。因此,可以配制化合物和它们生理上可接受的盐和溶剂化物,用于通过例如注射,吸入或吹入(通过嘴或鼻)给药或口服,颊含(buccal),肠胃外或直肠给药。
对于该治疗,可以将本发明化合物配制用于各种负荷的给药,包括系统和局部(topical)或定位(localized)给药。技术和配制通常可以在Remmington′s Pharmaceutical Sciences,Meade Publishing Co.,Easton,Pa中发现。对于全身给药,优选注射,包括肌内,静脉内,腹膜内和皮下。对于注射,可以将本发明化合物配制在液体溶液中,优选在生理相容的缓冲液如Hank’s溶液或Ringer’s溶液。另外,化合物可以以固体形式配制和在即将使用前再溶解或悬浮。还包括冻干形式。
对于口服给药,组合物可以采用例如片剂或胶囊的形式,其是通过常规方法用以下各项制备药用赋形剂如粘合剂(例如预先糊化的玉米淀粉,聚乙烯吡咯烷酮或羟丙基甲基纤维素);填充剂(例如乳糖,微晶纤维素或磷酸氢钙);润滑剂(例如硬脂酸镁,滑石或硅石);崩解剂(例如马铃薯淀粉或羟基乙酸淀粉钠);或湿润剂(例如十二烷基硫酸钠)。可以用本领域公知的方法包衣片剂。用于口服给药的液体制剂可以采取例如溶液,糖浆或混悬剂的形式,或者它们可以作为在使用前与水或其它适当载体组构的干产品存在。通过常规方法用药用添加剂可以制备这些液体制剂,所述药用添加剂如悬浮剂(例如山梨糖醇糖浆,纤维素衍生物或氢化食用脂肪);乳化剂(例如卵磷脂或阿拉伯胶);非水性载体(例如ationd油,油性酯,乙醇或分级的植物油);和防腐剂(例如甲基或丙基对羟基苯甲酸酯或山梨酸)。如果适当制剂还可以包含缓冲盐,调味剂,着色剂和甜味剂。
可以将用于口服给药的制剂适当地配制以产生活性化合物的控释。对于颊含给药组合物可以采取以常规方法配制的片剂或锭剂的形式。对于通过吸入给药,按照本发明使用的化合物便利地以来自加压包装或喷雾器的气溶胶喷雾呈递的形式使用适当的推进剂传递,所述推进剂例如二氯二氟甲烷,三氯氟甲烷,二氯四氟乙烷,二氧化碳或其它适当的气体。在加压气溶胶的情形中,通过提供阀门以传递计量的量可以测定剂量单位。可以配制用于吸入器或吹入器的例如明胶的胶囊和药筒,其包含化合物和适当粉末基质如乳糖或淀粉的粉末混合物。
可以配制化合物用于肠胃外给药,其通过注射例如通过大丸剂注射或连续输注。用于注射的制剂可以与加入的防腐剂以单位剂量形式,例如在安剖中或在多剂量容器中存在。组合物可以采取诸如在油性或水性载体中的混悬液,溶液或乳剂的形式,并且可以包含配制试剂如混悬剂,稳定剂和/或分散剂。备选地,活性成分可以是在使用前与适当载体例如无菌不含热原的水组构的粉末形式。
化合物还可以配制成直肠组合物如栓剂或保留灌肠剂,例如包含常规栓剂基质如可可油或其它甘油酯。
除了前述制剂,化合物还可以配制成贮存制剂。这些长效制剂可以通过移植(例如皮下或肌内)或通过肌内注射施用。因此,例如化合物可以用适当的聚合或疏水性物质(例如作为可接受油中的乳剂)或离子交换树脂配制,或配制成微溶衍生物,例如微溶盐。其它适当的传递系统包括微球体,其提供在延长时期的时间内局部非侵害传递药物的可能性。该技术利用前毛细血管大小的微球体,其可以经由冠状动脉导管注射到例如心脏或其它器官的任何选择的部分而不导致炎症或局部缺血。施用的治疗剂从这些微球体缓慢地释放并被周围组织细胞(例如内皮细胞)吸收。
还可以通过经粘膜或经皮的方法全身给药。对于经粘膜或经皮给药,在制剂中使用适于被渗透的屏障的渗透剂。该渗透剂在本领域公知,并且包括例如用于经粘膜给药胆汁盐和梭链孢酸衍生物。另外,可以使用洗涤剂以促进渗透。经粘膜给药可以通过鼻喷雾或使用栓剂。对于局部给药,本发明的寡聚体可以配制成本领域公知的软膏,药膏,凝胶,或乳膏。可以局部使用洗液以处理损伤或炎症以加速愈合。
如果需要,组合物可以存在于包装或分配器装置之中,其可以含有一种或多种含有活性成分的单位剂量形式。包装例如可以包含金属或塑料箔,如泡罩包装。包装或分配器装置可以附有给药使用说明。
4.7.鉴定治疗剂的测定基于导致或有助于与IL-1多态性或单倍型有关的疾病或紊乱发展的突变的鉴定,本发明另外特征在于用于鉴定治疗剂的基于细胞或无细胞的测定。在一个实施方案中,在测试化合物单独存在下或在测试化合物和另外的蛋白质的存在下,温育在其细胞膜外表面上表达IL-1受体或由与IL-1基因连锁不平衡的基因编码的蛋白质的受体的细胞,并例如通过使用微生理仪(microphysiometer)(McConnell等(1992)Science 2571906)检测测试化合物和受体之间或蛋白质(优选标记蛋白质)和受体之间的相互作用。通过微生理仪检测作为培养基酸化变化的受体和测试化合物或蛋白质之间的相互作用。该测定系统因此提供鉴定例如通过干涉蛋白质-受体相互作用起作用的分子拮抗物以及例如通过激活受体起作用的分子激动剂的方法。
细胞或无细胞测定还可以用于鉴定调节IL-1基因或与其连锁不平衡的基因的表达,调节mRNA翻译或调节mRNA或蛋白质稳定性的化合物。因此,在一个实施方案中,将能够产生IL-1或其它蛋白质的细胞,与测试化合物温育,测量细胞培养基中生产的蛋白质的量,并与从未与测试化合物接触的细胞中生产的量比较。通过各种对照分析,例如测量一个或多个对照基因的表达,可以证实化合物相对于蛋白质的特异性。特别是,该分析可以用于测定反义,核酶和三聚体化合物的功效。
无细胞测定还可以用于鉴定能够与蛋白质相互作用,由此改变蛋白质活性的化合物。该化合物可以例如修饰蛋白质的结构由此影响它与受体结合的能力。在优选实施方案中,用于鉴定这些化合物的无细胞测定基本上由反应混合物组成,所述反应混合物包含在结合配体的存在或不存在条件下蛋白质和测试化合物或测试化合物库。测试化合物可以是例如结合配体的衍生物,例如无生物活性的靶肽或小分子。
因此,本发明的一个示例性筛选测定包括将蛋白质或其功能片段与测试化合物或测试化合物库接触和检测复合体的形成的步骤。为了检测目的,分子可以用特异的标记来标记,测试化合物或测试化合物库用不同的标记标记。于是在温育步骤和洗涤步骤以后通过测定两种标记的水平可以检测测试化合物与蛋白质或其片段的相互作用。在洗涤步骤以后两种标记的存在表示相互作用。
通过使用检测表面等离子共振(SPR),一种光学现象的实时BIA(生物分子相互作用分析,Pharmacia Biosensor AB)也可以鉴定分子间的相互作用。检测依赖于在生物特异性界面大分子质量浓度的变化,不需要标记任何反应物。在一个实施方案中,可以将测试化合物库固定在传感器表面,例如,其形成微流量池的一个池壁。然后含有蛋白质或其功能片段的溶液连续流过传感器表面。如信号记录所示的共振角的变化显示相互作用已经发生。该技术例如在Pharmacia的BIA技术手册中进一步描述。
本发明另一示例性的筛选测定包括以下步骤(a)形成反应混合物,其包括(i)IL-1或其它蛋白质,(ii)适当的受体,和(iii)测试化合物;和(b)检测蛋白质和受体的相互作用。与缺乏测试化合物的相互作用相比,在测试化合物存在条件下蛋白质和受体的相互作用的统计学显著变化(加强或抑制)显示可能的拮抗物(抑制剂)。该测试的化合物可以同时接触。备选地,蛋白质可以首先与测试化合物接触适当量的时间,接着将受体加入反应混合物。通过使用各种浓度的测试化合物获得的数据产生剂量反应曲线可以评估化合物的功效。此外,还可以进行对照测定以提供比较的基线。
通过各种技术可以检测在蛋白质和受体之间的复合体形成。通过免疫测定,或通过色谱检测,使用例如可检测的标记蛋白质,如放射性标记,荧光标记,或酶促标记的蛋白质或受体,可以定量复合体形成的调节。
典型地,期望固定化蛋白质或受体以促进从非复合形式的一种或两种蛋白质中分离复合体以及适应测定的自动化。在任何适于包含反应物的容器中可以完成蛋白质和受体的结合。实例包括微量滴定板,试管,和微型离心管。在一个实施方案中,可以提供融合蛋白质,其增加允许蛋白质与基质结合的结构域。例如,谷胱甘肽-S-转移酶融合蛋白质可以吸附到谷胱甘肽琼脂糖珠粒(Sigma Chemical,St.Louis,MO)或谷胱甘肽衍生化的微量滴定板上,其然后与受体例如35S-标记的受体,和测试化合物结合,尽管稍微更严谨的条件可能更理想,在有助于复合体形成的条件下,例如在盐和pH的生理条件下,温育混合物。在温育后,洗涤珠粒以去除任何未结合的标记,将基质固定和直接测定放射性标记(例如将珠粒放于闪烁体中),或在随后将复合体解离后在上清液中测定。备选地,复合体可以从基质上解离,通过SDS-PAGE分离,使用如在后附实施例中所述的标准电泳技术从凝胶中定量在珠级分中发现的蛋白质或受体的水平。其它用于固定蛋白质于基质上的技术也可以供主题测定使用。例如,利用生物素和链霉抗生物素的偶联可以固定化蛋白质或受体。也可以制备转基因动物以鉴定激动剂和拮抗物或证实候选治疗剂的安全性和功效。本发明的转基因动物可以包括非人类动物,其包含在适当内源启动子的控制下或在异源启动子的控制下的再狭窄致病突变。
转基因动物还可以是含有在适当启动子的控制下转基因如报告基因或其片段的动物。这些动物用于例如鉴定如通过调节基因表达来调节IL-1蛋白质的生产的药物。获得转基因非人类动物的方法在本领域公知。在优选实施方案中,使用例如以期望模式控制表达的顺式作用序列,将再狭窄致病突变的表达限制在特定的细胞亚群,组织或发育阶段。在本发明中,这种蛋白质的嵌合表达可能对于许多连锁分析类型是关键性的,并且可以另外提供评估例如表达水平效果的方法,所述表达水平可能完全改变另外正常胚胎内小块组织的发育。为此,可以使用组织特异性调节序列和条件调节序列来控制在特定空间分布模式中突变的表达。此外,通过例如条件重组系统或原核转录调节序列可以提供表达的时间分布模式。遗传技术,其允许通过体内位点特异性遗传操作可以调节突变表达,对于本领域技术人员是已知的。
本发明的转基因动物在多个它们的细胞内都包括本发明的致病突变转基因,该转基因改变“宿主细胞”的表型。在说明性的实施方案中,可以使用噬菌体P1的cre/loxP重组酶系统(Lakso等(1992)PNAS 896232-6236;Orban等(1992)PNAS 896861-6865)或酿酒酵母(Saccharomyces cerevisiae)的FLP重组酶系统(O’Gorman等(1991)Science 2511351-1355;PCT公开WO 92/15694)来产生体内位点特异性遗传重组系统。Cre重组酶催化位于loxP序列之间的插入靶序列的位点特异性重组。loxP序列是Cre重组酶结合的34个碱基对的核苷酸重复序列并且为Cre重组酶介导的遗传重组所需。当Cre重组酶存在时,loxP序列的定向决定插入靶序列被切除或倒置(Abremski等(1984)J. Biol.Chem.2591509-1514);当loxP序列定向为正向重复时催化靶序列的切除,当loxP序列定向为反向重复时催化靶序列的倒置。
因此,靶序列的遗传重组取决于Cre重组酶的表达。重组酶的表达可以通过启动子元件调节,所述启动子受调节控制,例如组织特异性,发育阶段特异性,通过外加试剂可诱导的或可抑制的。这种调节的控制将仅在重组酶表达受启动子元件介导的细胞中导致靶序列的遗传重组。因此,通过控制重组酶表达可以调节致病突变转基因的表达的激活。
将cre/loxP重组酶系统用于调节致病突变转基因的表达要求构建含有编码Cre重组酶和主题蛋白质的转基因的转基因动物。通过构建“二重”转基因动物可以提供含有Cre重组酶和再狭窄致病突变转基因的动物。提供这些动物的便利方法是使两种各自含有一种转基因的动物交配。
使用原核启动子序列可以提供类似的条件转基因,为了促进转基因的表达所述原核启动子序列要求原核蛋白质同时表达。示例的启动子和相应的反式激活原核蛋白质在美国专利4,833,080中提供。
此外,通过类似基因治疗的方法可以诱导条件转基因的表达,其中将编码反式激活蛋白,例如重组酶或原核蛋白质的基因传递到组织并使如以细胞类型特异性的方式表达。通过该方法,转基因可以保持沉默至成年期直至通过引入反式激活物“开启”。
在例举的实施方案中,通过将转基因导入非人类动物的种系中生产本发明的“转基因非人类动物”。在不同发育阶段的胚胎靶细胞可以用来导入转基因。根据胚胎靶细胞的发育阶段使用不同方法。以普遍良好的健康,好的胚胎产率,在胚胎中良好的原核能见度,和良好的生殖适度选择用来实施本发明的任何动物的特定品系。另外,单倍型是一个重要因素。例如,当生产转基因小鼠时,经常使用品系如C57BUJ6或FVB品系(JacksonLaboratory,Bar Harbor,ME)。优选的品系是具有H-2b,H-2d或H-2q单倍型的那些如C57BL/6或DBA/1。用于实施本发明的品系它们本身可以是转基因的,和/或者可以是剔除物(knockouts)(即从一个或多个基因部分或完全被抑制的动物获得)。
在一个实施方案中,将转基因构建体导入单一阶段的胚胎。合子是显微注射的最好目标。在小鼠中,雄性原核达到直径约20微米的大小,其允许1-2pl DNA溶液的可重复注射。将合子用作基因转移的目标具有一个主要优势,即在大多数情形中注射的DNA将在第一次卵裂之前整合到宿主基因中(Brinster等(1985)PNAS 824438-4442)。结果,所有转基因动物细胞将携带整合的转基因。这通常也将反映在转基因有效的传递给建立者(founder)的后代,因为50%生殖细胞将含有转基因。
通常,将受精的胚胎在适当培养基中温育直至原核出现。约在此时,如下所述将包含转基因的核苷酸序列导入雌性或雄性原核。在一些物种如小鼠中,优选雄性原核。最优选在它被卵核或合子的雌性原核加工以前将外源遗传物质加至合子的雄性DNA互补体(complement)。认为卵核或雌性原核释放影响雄性DNA互补体的分子,其可能通过用组蛋白替换雄性DNA的鱼精蛋白,由此促进雌性和雄性DNA互补体的结合以形成二倍体合子。因此,优选在它受雌性原核的影响之前将外源遗传物质加入雄性DNA互补体或任何其它DNA互补体。例如,在形成雄性原核之后尽可能快地将外源遗传物质加入早期雄性原核,这时雄性原核和雌性原核很好地分离并且都位于近细胞膜。备选地,在它已经被诱导进行解凝聚以后可以将外源遗传物质加入精核。含有外源遗传物质的精子然后可以加入卵子或者可以将解凝聚的精子加入卵子,其后尽可能快地加入转基因构建体。
通过本领域已知的任何方法如例如显微注射,电穿孔或脂转染,可以完成将转基因核苷酸序列导入胚胎。在将转基因核苷酸序列导入胚胎以后,胚胎可以体外温育不同数量的时间,或重移植到替代宿主中,或两者都进行。体外温育至成熟在本发明的范围内。取决于物种,一种常规方法是将胚胎体外温育约1-7天,然后将它们重移植到替代宿主中。
为了本发明的目的,合子基本上是二倍体细胞的形成,其能够发育成完整的生物。通常合子将由含有通过融合来自一个配子或多个配子的两个单倍体核,天然或人工形成的核的卵子组成。因此,配子核必须是天然相容的配子核,即产生能生存的能够进行分化和发育成功能生物的合子的配子核。通常,优选整倍体合子。如果获得整倍体合子,那么相对于任何一个配子起源的生物的整倍体数量,染色体的数量改变应当不超过一个。
除了类似的生物学考虑,物理考虑也决定外源遗传物质的数量(例如体积),所述外源遗传物质可以加入合子的核或者可以形成合子核的一部分的遗传物质。如果未去除遗传物质,那么可以加入的外源遗传物质的量受将被吸收而不物理破坏性的量的限制。通常,插入的外源遗传物质的体积将不超过约10皮升。加入的物理影响不应该如此大以致物理上破坏合子的生存力。因为得到的合子的遗传物质,包括外源遗传物质必须在生物学上能够起始和保持合子的分化和发育成功能生物,DNA序列的数量和种类的生物学限制将根据具体合子和外源遗传物质的功能而变化,并且对于本领域技术人员将容易明显的。
加入合子的转基因构建体的拷贝数目取决于加入的外源遗传物质的总量,并且将是能够使遗传转化发生的量。理论上仅需要一个拷贝;然而通常使用许多拷贝,例如1,000-20,000个拷贝的转基因构建体,以便确保一个拷贝有功能。关于本发明,通常将是有利的是具有多于一个功能拷贝的每个插入外源DNA序列以增强外源DNA序列的表型表达。
只要它不对细胞,核膜或其它存在的细胞或遗传结构是破坏性的,可以使用允许加入外源遗传物质于核遗传物质中的任何技术。将外源遗传物质优选通过微量注射插入核遗传物质。细胞和细胞结构的微量注射是已知的并在本领域中使用。
使用标准方法完成重移植。通常,将替代宿主麻醉,将胚胎插入输卵管。移植到具体宿主中的胚胎的数量将随物种变化,但是将通常比得上物种天然生产的后代数量。
通过任何适当方法可以筛选替代宿主的转基因后代转基因的存在和/或表达。经常使用与转基因的至少一部分互补的探针,通过DNA印迹或RNA印迹分析完成筛选。可以使用利用针对由转基因编码的蛋白质的抗体的蛋白质印迹分析作为备选或另外的筛选转基因产物存在的方法。典型地,从尾组织中制备DNA并通过DNA印迹分析或PCR分析转基因。备选地,尽管任何组织或细胞类型可以用于该分析,但使用DNA印迹分析或PCR检验认为以最高水平表达转基因的组织或细胞转基因的存在和表达。
用于评估转基因存在的备选或另外的方法无限制地包括适当的生物化学测定如酶和/或免疫学测定,针对特定标记或酶活性的组织学染色,流式细胞仪分析等。血液的分析也可以用于检测血液中转基因产物的存在,以及评估转基因对各种类型的血细胞和其它血液成分的水平的影响。
通过将转基因动物与适当的配偶交配,或通过获自转基因动物的卵和/或精子的体外受精,可以获得转基因动物的后代。当进行与配偶交配时,配偶可以是或不是转基因的和/或剔除物;当它是转基因的时,它可以包含相同或不同的转基因,或都含有。备选地,配偶可以是母本品系。当使用体外受精时,可以将受精胚胎移植到替代宿主中或体外温育,或两者都进行。使用任一方法,使用上述方法或其它适当的方法可以评估后代转基因的存在。
按照本发明生产的转基因动物将包括外源遗传物质。另外,在该实施方案中,序列将附着在转录控制元件例如启动子上,所述启动子优选允许在特定类型的细胞中表达转基因产物。
逆转录病毒感染也可以用来将转基因导入非人类动物。发育的非人类胚胎可以体外培养至胚泡期。在该期间,可以以卵裂球为逆转录感染的目标(Jaenich,R.(1976)PNAS 731260-1264)。通过酶处理去除透明带可以获得卵裂球的有效感染(Manipulating the Mouse Embryo,Hogan eds.(ColdSpring Harbor Laboratory Press,Cold Spring Harbor,1986)。用于导入转基因的病毒载体系统典型地是携带转基因的复制缺陷的逆转录病毒(Jahner等(1985)PNAS 826927-6931;Van der Putten等(1985)PNAS 826148-6152)。通过在生产病毒的细胞单层上培养卵裂球容易或有效地获得转染(Van derPutten,上文;Stewart等(1987)EMBO J. 6383-388)。备选地,在后期可以进行感染。可以将病毒或产生病毒的细胞注射到囊胚腔中(Jahner等(1982)Nature 298623-628)。因为整合仅在形成转基因非人类动物的细胞亚群中发生,大多数建立者将是转基因的嵌合体。另外,建立者可以在基因组的不同位置包含转基因的各种逆转录病毒插入,其通常将在后代中分离。另外,还可以通过子宫内逆转录病毒感染怀孕间期胚胎将转基因导入种系(Jahner等(1982)上文)。
第三类用于转基因导入的靶细胞是胚胎干细胞(ES)。ES细胞获自体外培养和与胚胎融合的移植前的胚胎(Evans等(1981)Nature 292154-156;Bradley等(1984)Nature 309255-258;Gossler等(1986)PNAS 839065-9069;和Robertson等(1986)Nature 322445-448)。通过DNA转染或通过逆转录病毒介导的转导可以将转基因有效地导入ES细胞。该转化的ES细胞此后可以与来自非人类动物的胚泡结合。ES细胞此后移植(colonize)胚胎,并有助于得到的嵌合动物的种系。关于综述参见Jaenisch,R.(1988)Science 2401468-1474。
进一步通过下列实施例来举例说明本发明,所述实施例不应当被认为是以任何方式限制性的。所有引用的参考文献(包括贯穿本申请引用的文献参考,授权的专利,公开的专利申请)的内容特别结合于此作为参考。除非另外说明,本发明的实施将使用本技术领域内的常规技术。这些技术在文献中充分解释。参见例如Molecular Cloning A Laboratory Manual,(第二版,Sambrook,Fritsch和Maniatis,编辑.,Cold Spring Harbor LaboratoryPress1989);DNA Cloning,卷I和II(D.N.Glover编辑.,1985);Oligonucleotide Synthesis(M.J.Gait编辑.,1984);U.S.专利号4,683,195;U.S.专利号4,683,202;和Nucleic Acid Hybridization(B.D.Hames & S.J.Higgins编辑.,1984)。
5.实施例下面的实施例进一步支持但不排他性地表示本发明的优选实施方案。
实施例1IL-1基因座位的作图和表征已经鉴定编码具有IL-1折叠的蛋白质的6个新基因。分类家族涉及炎症信号。基于克隆和放射杂交作图已经将所有6个新基因以染色体2上的~400kb间隔放置在接近于或在与3个原有基因家族成员(IL1A,IL1B,IL1RN)相同的簇内。我们已经将不完全的公共数据库序列与我们自己的序列结合产生参考序列和包含所有新基因的图谱,允许确定基因结构,外显子的精确定位和常规SNP与微卫星标记之间距离的测定。从着丝粒至端粒的基因顺序是IL1A-IL1B-IL1F7-IL1F9-IL1F6-IL1F8-IL1F5-IL1F10-IL1RN,其中IL1A,IL1B和IL1F8仅向着丝粒转录。基因顺序与基因之间的进化关系有关。外显子边界的关键特征是保守的。没有其它IL-1家族成员在簇内的证据。
最近,显示与IL-1R1最紧密相关的受体,称为IL-1受体相关蛋白2(IL-1Rrp2,基因IL1RL2)赋予转染细胞对IL-1F9的应答性,该应答极有效地被最紧密类似IL-1ra的IL-1F5抑制。与IL-1F5的相互作用似乎是高亲和力的。IL-1F5和IL-1F9在上皮细胞中较丰富,已经提示它们在调节该特定区室的炎症中具有作用。其它基因的功能是未知的,但在IL-1F7和IL-18R1之间(Pan等,2001),和在IL-1F10和IL-1R1之间(Lin等,2001)已经报导低亲和力的相互作用。新IL-1家族成员的生物学作用正在研究中,但mRNA表达似乎与IL-1α,IL-1β,IL-1ra和IL-18所看到的相比远更有限。因此可能涉及新IL-1家族成员功能的细胞类型比IL-1情形的更特化。
材料和方法测序和序列拼接(sequence assembly)按照公共结构域中的部分序列(Lander等,2001)鉴定包含IL1A,IL1B,IL1RN和IL1F5的BAC,其先前已经作图为基因簇(Nicklin等,1994;Notwang等,1996;Barton等,2000)。9个选择的BAC为RP11-1I24,RP11-477F18,RP11-554I7,RP11-368A17,RP11-434I13,RP11-67L14,RP11-725J3,RP11-339F22,RP11-97J14和RP11-65I12。很多公共数据是未完成的,不包含序列或定向信息。将单个BAC的公共序列彼此对比提供最小重叠的信息。为了在区域内产生最小平铺支架(scaffold),选择7个BAC(RP11-477F18,RP11-554I7,RP11-434I13,RP11-67L14,RP11-725J3,RP11-339F22,RP11-97J14)并测序至3X覆盖度。在正向和方向上将小的插入质粒克隆(~3500bp)测序,提供跨越克隆的成对阅读。将PHRED和PHRAP(Ewing等,1998;Ewing和Green,1998)用于7个BAC的碱基调用和拼接。使用内部重叠群观察工具来分析得到的拼接。我们通过匹配其成对阅读落到其它重叠群末端的测序的重叠群末端来将重叠群排序。在该低覆盖率下,BAC拼接成大量重叠群,但确定了顺序和定向。从Genebank输入7个内部测序的BAC以及2个外部完成的BAC(RP11-1I24和RP11-65I12)的公共数据。使用各种软件工具比较和排列内部的,公共的和重叠顺序,提供跨越所有可用数据的顺序和定位信息。然后从这些排列中选择重叠群以在区域内产生尽可能多的连续序列,并使用Sequencher(4.0.5版)拼接。
序列对比和外显子定位用在NCBI服务器上运行的2-序列BLAST程序(Altschul等,1997)将引物和cDNA序列最初与基因组序列匹配。用在HGMP服务器(Cambridge,UK)上运行的est2基因组程序(Mott,1997)进行外显子对比。设置程序以鉴定共有的外显子边界。将由于它们较短不能鉴定的5’外显子手工定位在最近的在共有剪接供体二核苷酸(GT)处终止的对应序列。未尝试将非编码区的3’末端作图,因为mRNA大小数据大多不可获得。
结果IL-1簇的序列将900kb区域拼接成14个有序的结合内部和公共序列的连续序列。该序列的端粒部分包含基因PAX8。随后,从该区域中提取由7个重叠群组成的较短区域,总共496kb。公共数据库的近来更新已经使我们将序列中6个缺口中的5个补平。(参见图17)。我们已经向公共数据库提交495475个核苷酸的注解的序列,如本报告所述(登记号***)。剩余的单个缺口(在图17上标记“缺口”)是IL-1簇的着丝粒。序列不是完成质量但为完成序列提供框架和允许我们检查基因在IL-1簇内的结构。新图谱与先前公开的图谱(Nicklin等,1994;Nothwang等,1996)一致,但基本上不同于不完全的公共基因组拼接计划(Lander等,2001)。
向着丝粒最近的鉴定的侧翼基因与IL-1无关。它是质膜磷酸盐转运蛋白SLC20A1(以前鉴定为长臂猿白血病病毒受体,GLVR1的人同系物,登记号XM_002217),其定位(map)于图1中在原点左边63kb-45kb之间。向该簇的端粒方向存在TIC(登记号NM_012455),其最有可能是ARF6-选择性的鸟嘌呤核苷酸交换因子(MN和Tomas Klenka,准备手稿),其在端粒侧翼。它的图谱位置在图17中显示。
基因结构我们已经将所有IL-1家族的cDNA序列作图在基因组序列上(图17),其中基因的范围用黑长方形表示。图17显示IL-1基因簇的图谱。在数据之上和之下提供刻度线(kb)以帮助对比。所述数据的来源通过上部三条线表示。在基因组治疗学上完全测定“新序列”。“公共DB”显示取自Genbank的序列。从两个来源的组合拼接“组合序列”。在表示重叠群的短线上面,用标记的箭头表示先前描述的多态性标记的位置(Cox等概述,1996和di Giovine等,2000)。还显示单个未填满的缺口。如本文定义的富含CpG的区域表示为“CpGr”。还将用于先前作图的稀有切割限制酶位点簇的可能位点标记为“Xrec”,“Yrec?”,和“Zrec”。图18的cDNA序列作图在重叠群上的范围通过重叠群线之下的实心黑长方形表示,除了非细胞因子基因TIC以外,其标记为灰色。CE1,CE2和CE3的编码序列位置通过垂直线表示。基因符号之前或之后有V形标记以表示转录方向。图17进一步显示IL-1簇的详细结构。从着丝粒至端粒顺序列出每个基因。“基因”基因的常规基因座名称。“定向”或者为“正向”,其中存放的序列是有义链,或“反向”,其中它是反义的。“位置”是在存放的序列上对应于每个外显子的核苷酸数目。
当已知cDNA序列为不完全时,类似的外显子延伸用“<”和“>”符号标记。“外显子”是我们基于它在对应转录物之一的cDNA中的存在赋予每个外显子的名称;因此IL1RN-a4/b5/c6是cDNA a(X52015)的第4个外显子,cDNA b(M55646)的第5个外显子和cDNA c的第6个外显子。已经认可对应的mRNA的身份(**)。针对相邻条目的星号(*)表示两个外显子共有剪接供体位点,其为使用备选启动子的结果。“外显子边界”是外显子内部侧邻内含子的15个核苷酸序列。两个末端的省略号(…)表示外显子可能因为cDNA序列已经被截短而不完全。“外显子类型”表示外显子的编码潜力5’N,5’-非翻译区域;5’SO,可能翻译的5,短可读框;Ps,肽前序列(表示这已经被提出);cs,不保守的编码序列;CE,保守外显子;3’N,3’-非翻译区域。省略号表示外显子分配可能是不完全的,一些或所有非编码序列已经省略。“编码”表示由每个外显子编码的氨基酸序列。通过cDNA名称和它们组成的登记号(在盒顶部表示)来鉴定外显子。每个外显子的编码能力以小写体表示。斜体残基部分在下一个外显子上编码。数字上标表示在包含在密码子内所述外显子中的碱基数。残基从下一个外显子中省略。在桥连(bridging)密码子中的核苷酸通过“外显子边界”盒中的斜体表示。在随后的外显子是交错的时候,桥连残基可以改变。这在括号中表示。加下划线的残基来自外显子的末端完整密码子,它们的密码子在“外显子边界”盒中加下划线。星号表示翻译终止。ILA大部分是着丝粒基因,并向着丝粒转录,如相邻的基因,IL1B。剩余的基因,以IL1RN结束,簇的大部分端粒成员,向端粒转录,除了IL1F8以外。每个基因的最后3个外显子,我们称为共有外显子(CE)1,2和3,编码IL-1-同源区域(如图18所示和在别处定义),并且落入序列的紧密区域。CE1,CE2和CE3在图1中通过垂直线表示,但在图17的分辨率下,一些不能区分。具有很少或无编码内容的另外的外显子大大地扩展了大部分基因的范围。最大的跨度是IL1RN和IL1F8。在后者情形中,第一个非编码外显子是基因剩余部分的20kb端粒。与每个外显子的编码肽序列一起给出基因作图的细节。当剪接变体存在时,该信息使阅读者能够拼接不同的可能的蛋白质形式。当前不确定所有这些形式是否可能是生物学相关(参见讨论)。
图18(1-7张)显示10个已知IL-1家族成员的3个共有外显子的编码序列的对比。在每个情形中共有外显子是最后3个转录物;例如IL-1α的7个外显子中的外显子5,6和7。通过寻找氨基酸同一性和类似残基组用眼睛完成对比。然后将缺口最小化。结合IL-1β和IL-1ra的晶体学数据并进一步用于改进对比。顺序表示3个共有外显子部分的翻译。数字表示由每个外显子编码的成熟产物的第一个和最后一个密码子。根据它们可能的系统发育列出基因产物。(!)表示在蛋白水解位点加工产生成熟蛋白质,但前序列中的一些也在第一个共有外显子内编码。加框的残基对于至少3个序列共有。为了简单,不显示相似性。对于IL-1β和IL-1ra,在编码序列以下的第一行上,(标记的“结晶学”)β-折叠末端的近似位置通过垂直线表示,折叠的跨度划灰色阴影线并用折叠数标记。在下一条线(标记的“接触点”)中,数字表示IL-1R与每个残基侧链相互作用的结构域。编号的残基包含至少1个重原子(C,N,O,S),其位于I型IL-1受体重原子的4内部(PDB数据),如程序RasMol(Sayle和Milner-White)所显现。在IL-1F5下面的行(标记的NMR)中,(^)表示在它们的α-13CNMR信号中显示强烈的高磁场位移(>0.7)的IL-1F5的残基,这被认为显示在β-折叠内它存在的高概率。框图的最后一条线(标记的“共有”)表示以小写体,在该位点出现至少7/10次的残基。当大写时,残基存在于所有情形中。省略号表示特定序列的折叠1可能在前面的外显子上开始。(*)表示翻译终止。
富含CpG区域使用程序CpGplot(Larsen等,1992)鉴定5个可能的CpG岛,其具有60%C+G含量,60%的CpG二核苷酸的期望频率和长度300个核苷酸。除了第一个和最后两个富含CpG序列,这些区域较短和可能不构成“CpG岛”。因此在IL-1簇中不存在CpG岛。我们已经尝试定位先前用于物理作图的限制位点簇(Nicklin等,1994)。富含CpG的序列在图1中标记CpGr。两个另外标记为Xrec和Zrec。这两个区域包含先前鉴定的稀有的特异切割位点,因此可能对应于簇的侧翼,如先前指定。与先前估计从基因组DNA的限制消化的Southern杂交430kb相比,序列数据提供392kb的长度。先前用于将IL1B作图的Nae I和Eag I位点的紧密配对在标记Yrec?的位点周围发现,但即使用较不严谨的参数也不被程序CpGplot所选择。仅Xrec和Zrec标记大量的CpG岛。数据库搜索和公共基因组注解努力还未显示与这些基因座任何一个有关的基因。一个可能是Zrec标记TIC未被识别的上游外显子,其为一个在所有检验组织中大量表达的非细胞因子基因(Tomas Klenka和MN,未公开数据)。
IL-1簇中的多态性标记我们已经将多态性定位在先前已经描述的该区域中(通过图17中的箭头表示和在图19中列出)。这允许我们重新评估前述不平衡数据(Cox等,1998)。我们的分析给出稍微更好的在图谱距离和不平衡衰减之间的相关系数(数据未显示)。
扫描IL-1簇另外的类IL-1基因我们研究在IL-1簇内部是否存在另外的类IL-1序列。因为它们较小的尺寸,该簇的基因组序列可经受用BLAST算法(Altschul等,1997)的极低严谨性的搜索。以其缺省设置使用NCBI服务器的两个序列的BLAST比较,除了将灵敏度升高至期望每个基因组5000次碰击(hit)(其缺省值为10)。将单个外显子的翻译提交用于IL-1簇基因组序列的TBLASTN分析。该算法针对来自基因组序列片段的6个可能的阅读框进行编码序列的搜索。我们假设外显子结构将是保守的,如果它们被终止密码子中断,匹配随后折扣。
因为它是更远的相关序列之一,我们首先用IL1A的CE3搜索。这仅与其自身匹配。IL1B的CE3重现(return)除了IL1A外在IL-1簇上所有已知家族成员的CE3。发现一个连续碰击,但它仅共有6个相同的推定残基,长于典型的CE3,并实际上位于IL1B的反方向。序列是折扣的(discounted),因为没有对应的可能的上游CE2的证据。我们接下来用IL1F5的CE3搜索,其也重现除了IL1A以外的所有CE3。一条长的可能的富含CpG的外显子缺乏CE3的保守核心残基。作为另外的异常值,我们使用IL18(登记号XM_041373)的CE3。这从IL-1簇重现IL1F5和无新序列。我们接下来检验来自IL1A和IL1B的CE2(外显子6)。前者仅重现自身,后者重现IL1F6,IL1F8,IL1F9和IL-10和无其它序列。IL1F5的CE2重现IL1RN,IL1F6,IL1F9和IL1F10,但无新的连续的外显子。IL18的CE2无重现。最后测试IL1F9的CE2。它重现IL1F6,IL1F8,ILIRN,ILF10的CE2和无其它序列。我们得出结论在IL-1簇内不存在另外的IL-1家族基因,除非它们具有高度发散的序列或者在具有更多分段的外显子结构方面不同于所有其它家族成员。
进化考虑为了研究IL-1家族的种系发生,我们运行程序Tree-Puzzle(Strimmer和yon Haesler,1996)对比图2a所示的CE3。将IL-18设置为家族的外组(outgroup)成员。结果在图3所示的辐射状的系统树(Page,1996)中显现。
实施例2炎性基因和冠心病的病例-群组研究(社区动脉粥样硬化风险(Atherosclerosis Risk in Communities)(ARIC)计划的子研究)ARIC是预期的群组研究,其设计来研究动脉粥样硬化的病因学和自然历史,临床动脉粥样硬化疾病的病因学,和随种族,性别,地点和时间的心血管风险因子,医疗,疾病的变化。
ARIC群组由来自四个美国社区年龄基准为45-64岁的15,792个个体的概率样本组成。批准ILGN对所有ARIC计划参与者基因分型以适当地满足两个合作的子研究的目的。在我们正在进行的意外心血管事件的研究中,我们现在具有来自955个ARIC参与者的DNA样品,所述参与者与随机抽样的群组对照组一起经历急性临床事件。这些样品代表在纵向监控的开始11年期间所有的意外心血管情形。最近完成所有样品的基因分型,可获得部分结果。这些结果证明对于总胆甾醇(TC)<200mg/dl的受试者,临床事件的风险与IL-1(+4845)等位基因2之间显著相关。这些发现的关键方面包括●+4845基因型显著与临床事件相关(存活率分析相对危险性~4.0,p<.01)●分析包括所有年龄●在多变量模型中,IL-1基因型发现与年龄,性别,吸烟,种族,糖尿病,高血压,BMI,LDL,HDL无关
●TC<200包括的受试者的数量为955基因座IL1A(+4845),总胆甾醇<200mg/dl层第一次急性冠状动脉病事件的时间在每个表中存在三个模型。第一个是仅具有基因型变量的原型。这通过调整栏中的“原型”识别。在调整栏中“组1”的模型对年龄,性别和种族/根源(center)调整。在调整栏中“组2”的那些对年龄,性别,种族/根源,现在吸烟者(是/否),糖尿病(是/否),高血压(是/否),LDL胆甾醇,和HDL胆甾醇。针对‘1.1’基线比较‘1.2’和‘2.2’。
针对‘1.1’和‘1.2’一起的基线比较‘2.2’
排除具有‘1.2’的受试者针对‘1.1’的基线比较‘2.2’
实施例3旧金山骨质疏松症骨折研究(SOF)在旧金山加州大学Steven Cummings博士指导下的多根源(multi-center)骨质疏松症骨折研究,由大群组的来自4个不同临床中心的欧洲/白种人血统的妇女组成。自1986年始已经检查这些妇女各种医学和生活方式发现,包括臀部,腕和脊柱骨折和腰椎和股颈中的骨矿物密度变化。在基线访问时(1986/1987)所有参与者(n=9,704)65岁或更年长,能走动和未住院(not institionalized)。从约4,000名受试者收集血样并保存在-70℃用于DNA分析。
最近的SOF群组死因分析确定IL-1A(4845)等位基因2与心血管病早期死亡显著相关。
实施例4+4845IL-1SNP的功能分析+4845IL-1SNP是非同义的SNP(即天然存在的多态性,其改变氨基酸并导致IL-1a细胞因子中的氨基酸变化)。使用杆状病毒载体(bacculoviral vector)在昆虫细胞中表达变体蛋白质,并分析结构和功能差异。通过序列分析证实用于昆虫细胞和哺乳动物细胞中蛋白质表达的变体cDNA仅包含一个导致氨基酸变化的SNP。这里有2个与该SNP有关的数据。
在蛋白质印迹分析中(参见图12),我们提供数据显示IL-1a细胞因子的2个变体被钙蛋白酶消化而不同地加工。钙蛋白酶是已知切割全长IL-1a细胞因子(31kDa)以形成成熟蛋白质(17kDa)的酶。等位基因-1(Ala)IL-1a细胞因子产生单个17kDa的分子,而等位基因-2(Ser)IL-1a细胞因子产生2条带,一条大小与等位基因-1发现的条带相同,但另外它还产生分子量稍微更大的另一条带。该结果显示在2个变体中存在结构差异。我们还假定Ala至Ser的突变导致蛋白质的不同的翻译后修饰,例如,磷酸化或肉豆蔻酸化(myristolation)的差异。该氨基酸变化可以导致翻译后修饰的识别信号改变(增加或去除)。
发现用表达载体中的ala和ser变体cDNA稳定转染的成纤维细胞具有不同的增殖速率。等位基因-2变体具有比等位基因-1变体更快的生长速率,这支持我们的主张即等位基因-2预示促炎特性(profile)。(参见图13)。因此,在等位基因-2变体中改变的氨基酸显示比等位基因-1变体更有效的促炎细胞因子的证据。
实施例5IL-1A,IL-1B和IL-1RN SNP的系统功能分析在本实施例中,在非“野生型”IL-1序列的背景中构建所选IL-1A,IL-1B,和IL-1RN多态性,在成纤维细胞系中测量效果。
通过报告基因-启动子构建体转录分析IL-1A,IL-1B,IL-1RN基因启动子SNP。每个基因的数据在分开的图中(即分别为图14,15和16)。图14,15,和16图片A(和图15D)显示SNP和不同的等位基因-2突变,其在分开的荧光素酶构建体和还有不同长度的用转染分析中研究的SNP注释的启动子-荧光素酶构建体中产生。另外,我们还提供仅关于功能SNP的荧光素测定结果,其显示相对于野生型(在所有基因座的等位基因-1)改变的基因转录活性。对于B基因,我们也提供关于骨架中功能SNP的数据,其中SNP#14(-511)和SNP#2(-31)也为等位基因-2。
注意这些构建体在成纤维细胞系(即WI38-其模拟IL-1在炎性应答中的特殊作用)中测试。因此,将特别地检测其它模拟IL-1-介导的炎性疾病和病症其它机制方面的细胞系。例如人细胞单核细胞系(例如U937)和人karatinocyte细胞系(例如A143)和在人成骨细胞系中(例如以研究对骨质疏松症IL-1炎性过程的影响。
实施例6IL-1基因簇SNP的注释我们已经进一步在整个IL-1基因簇中注释多态性(参见图8-11)。因为这些多态性在如本文支持的确定的IL-1单倍型内存在(参见图1-7),它们提供在本申请中支持的组合物和方法。
等价物和通过参考结合本领域技术人员将认识到或者能够使用仅仅常规实验确认,本文所述的具体多肽,核酸,方法,测定和试剂的许多等价物。这些等价物被认为在本发明的范围内并为下面的权利要求所覆盖。
本申请包括许多已知文本的引用,公开文章和专利申请以及授权的美国和外国专利。所有这些引用的完整内容由此结合于此作为参考。
权利要求
1.一种用于确定受试者是否患有或倾向于发展与IL-1炎性单倍型有关的疾病或症状的方法,其包含检测如图1,2A,2B,7A或7B中任何一个所示的IL-1等位基因。
2.权利要求1的方法,其中检测至少两个包含在图1,2A,2B,7A或7B中任何一个的等位基因。
3.权利要求2的方法,其中所述两个等位基因具有至少0.5的连锁不平衡值(D’)。
4.权利要求2的方法,其中所述两个等位基因具有至少0.6的连锁不平衡值(D’)。
5.权利要求2的方法,其中所述两个等位基因具有至少0.6的连锁不平衡值(D’)。
6.权利要求2的方法,其中所述两个等位基因具有至少0.7的连锁不平衡值(D’)。
7.权利要求2的方法,其中所述两个等位基因具有至少0.8的连锁不平衡值(D’)。
8.权利要求2的方法,其中所述两个等位基因具有至少0.9的连锁不平衡值(D’)。
9.一种用于确定受试者是否患有或倾向于发展与IL-1炎性单倍型表型有关的疾病或症状的方法,其包含检测如图3A,3B,4A,4B,5A,5B,6A,或6B中任何一个所示的IL-1单倍型的特征型式。
10.权利要求9的方法,其中所述IL-1单倍型包含如图3A和3B所示的hap1型式。
11.权利要求9的方法,其包含检测hap1型式T_T_C/2_2_1的三个等位基因。
12.权利要求9的方法,其中所述IL-1单倍型包含如图4A和4B所示的hap2型式。
13.权利要求9的方法,其包含检测hap2型式G_C_T/1_1_2的三个等位基因。
14.权利要求9的方法,其中所述IL-1单倍型包含如图5A和5B所示的hap3型式。
15.权利要求9的方法,其包含检测hap3型式G_C_C/1_1_1的三个等位基因。
16.权利要求9的方法,其中所述IL-1单倍型包含如图6A和6B所示的hap4型式。
17.权利要求9的方法,其包含检测hap4型式C_C_C/1_1_1的三个等位基因。
18.用于检测IL-1多态性的IL-1多核苷酸序列,其包含如图8,9,10A,10B或11中任何一个所示SNP序列的至少12个连续核苷酸的新核酸,或其互补序列。
19.权利要求18的IL-1多核苷酸序列,其中所述新核酸序列包含如图8,9,10A,10B或11中任何一个所示SNP序列的至少14个连续核苷酸,或其互补序列。
20.权利要求18的IL-1多核苷酸序列,其中所述新核酸序列包含如图8,9,10A,10B或11中任何一个所示SNP序列的至少17个连续核苷酸,或其互补序列。
21.权利要求18,19或20中任何一项的IL-1多核苷酸序列,其中所述SNP序列是IL-1A SNP,其选自由以下各项组成的组IL-1A SNP #1;IL-1A SNP #2;IL-1A SNP #3;IL-1A SNP #4;IL-1A SNP #9;IL-1A SNP #10;IL-1A SNP #11;IL-1A SNP #14;IL-1A SNP #15;IL-1A SNP #16;IL-1A SNP#19;IL-1A SNP #24;IL-1A SNP #25IL-1A SNP#;IL-1A SNP #30;IL-1ASNP #31;IL-1A SNP #33;和IL-1A SNP #34。
22.权利要求18,19或20中任何一项的IL-1多核苷酸序列,其中所述SNP序列是IL-1B SNP,其选自由以下各项组成的组IL-1B SNP #1;IL-1B SNP #2;IL-1B SNP #3;IL-1B SNP #4;IL-1B SNP #5;IL-1B SNP #6;IL-1B SNP #7;IL-1B SNP #8;IL-1B SNP #9;IL-1B SNP #17;IL-1B SNP #19;IL-1B SNP #35;和IL-1B SNP #38。
23.权利要求18,19或20中任何一项的IL-1多核苷酸序列,其中所述SNP序列是IL-1RNic SNP,其选自由以下各项组成的组IL-1RNic SNP#14;IL-1RNic SNP #14;IL-1RNic SNP #18;IL-1RNic SNP #21;IL-1RNicSNP #22;IL-1RNic SNP #26;IL-1RNic SNP #29;IL-1RNic SNP #30;IL-1RNic SNP #31;IL-1RNic SNP #32;IL-1RNic SNP #33;IL-1RNic SNP#34;IL-1RNic SNP #35;IL-1RNic SNP #36;IL-1RNic SNP #37;IL-1RNicSNP #38;IL-1RNic SNP #40;IL-1RNic SNP #42;43;IL-1RNic SNP #65;IL-1RNic SNP #67;IL-1RNic SNP#;68;和IL-1RNic SNP #82。
24.权利要求18,19或20中任何一项的IL-1多核苷酸序列,其中所述SNP序列是IL-1RNsec SNP,其选自由以下各项组成的组IL-1RNsecSNP #67;IL-1RNsec SNP #68;IL-1RNsec SNP #82;和IL-1RNsec SNP #93。
25.一种用于IL-1基因分型的试剂盒,其包含至少两个权利要求18,19或20中任何一项的多核苷酸。
26.一种用于IL-1基因分型的试剂盒,其包含至少两个多核苷酸,该多核苷酸是至少12个连续的选自由以下各项组成的组的核苷酸IL-1ASNP #1;IL-1A SNP #2;IL-1A SNP #3;IL-1A SNP #4;IL-1A SNP #9;IL-1ASNP #10;IL-1A SNP #11;IL-1A SNP #14;IL-1A SNP #15;IL-1A SNP #16;IL-1A SNP #19;IL-1A SNP #24;IL-1A SNP #25IL-1A SNP#;IL-1A SNP #30;IL-1A SNP #31;IL-1A SNP #33;和IL-1A SNP #34;IL-1B SNP #1;IL-1BSNP #2;IL-1B SNP #3;IL-1B SNP #4;IL-1B SNP #5;IL-1B SNP #6;IL-1BSNP #7;IL-1B SNP #8;IL-1B SNP #9;IL-1B SNP #17;IL-1B SNP #19;IL-1B SNP #35;和IL-1B SNP #38;IL-1RNic SNP #14;IL-1RNic SNP #14;IL-1RNic SNP #18;IL-1RNic SNP #21;IL-1RNic SNP #22;IL-1RNic SNP#26;IL-1RNic SNP #29;IL-1RNic SNP #30;IL-1RNic SNP #31;IL-1RNicSNP #32;IL-1RNic SNP #33;IL-1RNic SNP #34;IL-1RNic SNP #35;IL-1RNic SNP #36;IL-1RNic SNP #37;IL-1RNic SNP #38;IL-1RNic SNP#40;IL-1RNic SNP #42;43;IL-1RNic SNP #65;IL-1RNic SNP #67;IL-1RNic SNP#;68;IL-1RNic SNP #82;IL-1RNsec SNP #67;IL-1RNsecSNP #68;IL-1RNsec SNP #82;和IL-1RNsec SNP #93。
27.一种为个体选择适当治疗剂的方法,所述个体患有或倾向于发展与IL-1多态性有关的疾病或症状,该方法包含以下步骤通过检测如图1,2A,2B,7A或7B中任何一个所示的IL-1等位基因检测IL-1炎性单倍型;和选择补偿所检测的IL-1炎性单倍型的治疗剂。
28.权利要求27的方法,其中检测检测至少两个包含在图1,2A,2B,7A或7B中任何一个的等位基因。
29.权利要求28的方法,其中所述两个等位基因具有至少0.5的连锁不平衡值(D’)。
30.权利要求28的方法,其中所述两个等位基因具有至少0.6的连锁不平衡值(D’)。
31.权利要求28的方法,其中所述两个等位基因具有至少0.6的连锁不平衡值(D’)。
32.权利要求28的方法,其中所述两个等位基因具有至少0.7的连锁不平衡值(D’)。
33.权利要求28的方法,其中所述两个等位基因具有至少0.8的连锁不平衡值(D’)。
34.权利要求28的方法,其中所述两个等位基因具有至少0.9的连锁不平衡值(D’)。
35.权利要求27的方法,其包含检测hap1 IL-1单倍型。
36.一种确定特定治疗剂在治疗具有炎性疾病表型的个体中是否有效的方法,其包含通过检测如图1,2A,2B,7A或7B中任何一个所示的IL-1等位基因检测IL-1单倍型;检测个体中的炎性表型;用所述治疗剂治疗该个体;和确定该个体中的炎性表型是否被所述治疗剂消除或减轻,其中,如果该个体的炎性表型被所述治疗剂消除或减轻,那么所述治疗剂在治疗具有所检测的IL-1单倍型的个体中有效。
37.权利要求36的方法,其中所述治疗剂是营养物。
38.权利要求36或37的方法,其中所述IL-1单倍型选自由hap1,hap2,hap3和hap4组成的组。
39.权利要求38的方法,其中检测至少一个选自由以下各项组成的组的IL-1等位基因IL-1A SNP #1;IL-1A SNP #2;IL-1A SNP #3;IL-1A SNP#4;IL-1A SNP #9;IL-1A SNP #10;IL-1A SNP #11;IL-1A SNP #14;IL-1ASNP #15;IL-1A SNP #16;IL-1A SNP #19;IL-1A SNP #24;IL-1A SNP #25IL-1A SNP #;IL-1A SNP #30;IL-1A SNP #31;IL-1A SNP #33;和IL-1ASNP #34;IL-1B SNP #1;IL-1B SNP #2;IL-1B SNP #3;IL-1B SNP #4;IL-1BSNP #5;IL-1B SNP #6;IL-1B SNP #7;IL-1B SNP #8;IL-1B SNP #9;IL-1BSNP #17;IL-1B SNP #19;IL-1B SNP #35;和IL-1B SNP #38;IL-1RNic SNP#14;IL-1RNic SNP #14;IL-1RNic SNP #18;IL-1RNic SNP #21;IL-1RNicSNP #22;IL-1RNic SNP #26;IL-1RNic SNP #29;IL-1RNic SNP #30;IL-1RNic SNP #31;IL-1RNic SNP #32;IL-1RNic SNP #33;IL-1RNic SNP#34;IL-1RNic SNP #35;IL-1RNic SNP #36;IL-1RNic SNP #37;IL-1RNicSNP #38;IL-1RNic SNP #40;IL-1RNic SNP #42;43;IL-1RNic SNP #65;IL-1RNic SNP #67;IL-1RNic SNP#;68;和IL-1RNic SNP #82;IL-1RNsecSNP #67;IL-1RNsec SNP #68;IL-1RNsec SNP #82;和IL-1RNsec SNP #93;IL-1A SNP #1;IL-1A SNP #2;IL-1A SNP #3;IL-1A SNP #4;IL-1A SNP #9;IL-1A SNP #10;IL-1A SNP #11;IL-1A SNP #14;IL-1A SNP #15;IL-1A SNP#16;IL-1A SNP #19;IL-1A SNP #24;IL-1A SNP #25 IL-1A SNP#;IL-1ASNP #30;IL-1A SNP #31;IL-1A SNP #33;IL-1A SNP #34;IL-1B SNP #1;IL-1B SNP #2;IL-1B SNP #3;IL-1B SNP #4;IL-1B SNP #5;IL-1B SNP #6;IL-1B SNP #7;IL-1B SNP #8;IL-1B SNP #9;IL-1B SNP #17;IL-1B SNP #19;IL-1B SNP #35;IL-1B SNP #38;IL-1RNic SNP #14;IL-1RNic SNP #14;IL-1RNic SNP #18;IL-1RNic SNP #21;IL-1RNic SNP #22;IL-1RNic SNP#26;IL-1RNic SNP #;29;IL-1RNic SNP #30;IL-1RNic SNP #;31;IL-1RNicSNP #32;IL-1RNic SNP #33;IL-1RNic SNP #34;IL-1RNic SNP #35;IL-1RNic SNP #36;IL-1RNic SNP #37;IL-1RNic SNP #38;IL-1RNic SNP#40;IL-1RNic SNP #42;43;IL-1RNic SNP #65;IL-1RNic SNP #67;IL-1RNic SNP#;68;IL-1RNic SNP #82;IL-1RNsec SNP #67;IL-1RNsecSNP #68;IL-1RNsec SNP #82;和IL-1RNsec SNP #93。
全文摘要
本发明提供涉及鉴定和使用来自IL-1基因簇的遗传信息的方法和组合物,所述遗传信息包括在IL-1的基因座中发现的新的类IL-1基因的结构和组构以及这些基因内部的多态性和相关的单倍型。本发明由此扩展了从IL-1基因座可获得的有用遗传信息的所有组成部分,其包含先前鉴定的IL-1α,IL-1β和IL-1RN基因,用于预测IL-1相关表型(例如增加或减小的炎性疾病的风险)和用于治疗I1-1单倍型相关的炎性表型。
文档编号C07H21/04GK1751127SQ03806113
公开日2006年3月22日 申请日期2003年1月27日 优先权日2002年1月25日
发明者马丁·尼克林, 戈登·达夫, 肯尼思·科恩曼, 马里亚姆·拉菲·科尔平, 谢忠明, 拉朱·戈文达拉朱, 纳兹尼恩·阿齐兹, 克里斯·坎宁 申请人:白介素遗传公司