专利名称:使用多基因计分预测向晚期老年性黄斑变性的进展的制作方法
技术领域:
本发明涉及用于鉴定具有更大风险进展为晚期老年性黄斑变性(AMD)的患有中期AMD的个体的方法,所述方法使用基于全基因组基因关联研究的结果计算的多基因计分,并使用数千种单核苷酸多态性(SNP)。
背景技术:
老年件黄斑变件(Age-Related Macular Degeneration, AMD)AMD是老年性黄斑变性,其是60岁以上个体不可逆视觉功能障碍的主要原因。存在两类AMD,非渗出性(干性)和渗出性(湿性)AMD。干性或非渗出性形式涉及在中心视网膜(黄斑)之下的视网膜色素上皮(RPE)的萎缩性及肥大性改变以及RPE上的沉淀(玻璃疣)。患有非渗出性AMD的患者可能进展为湿性或渗出性形式的AMD。当疾病进展时,初始形成的玻璃疣在尺寸和数量上增长。在AMD的晚期,被称为脉络膜新生血管膜(CNVM)的异常血管在视网膜下发展,渗出流体和血,并最终导致视网膜中和视网膜下的致盲的椭圆形瘢痕。非渗出性AMD,通常是渗出性AMD的前身,其更常见。全基因组关联研究在人基因组测序的同时,进行了国际范围的努力以开发人基因组的单体型图谱,即HapMap,其描述了人DNA序列变化的一般模式。HapMap项目始于2002年,并且通过定期的发表其结果已是公众可自由获知的。此外,基因分型(genotyping)技术和分析的快速改进已经使以下成为可能:在大群体上进行全基因组关联研究,从而鉴别具有显著群体频率的遗传变异。这又允许研究多基因病和性状。从那时起,全基因组关联研究已经识别大量遗传性基因座,其中存在与多基因性状可重复地关联的常见遗传变体。见,例如 Altshuler 等,Sc ience(2008), 322:881-8(genetic mapping inhuman disease (人疾病中的基因定位));Mohkle 等,Hum Mol Genet (2008) 17:R102-R108 (common geneticvariations associated with metabolic and cardiovasular diseases (与代谢和心血管疾病相关的常见遗传变异));Lettre 等,Hum Mol Genet (2008):17-R116-R121 (commongenetic variations associated with autoimmune diseases (与自体免疫疾病相关的常见遗传变异));Purcell 等,Nature (2009)460(7256):748-52 (common genetic variationsassociated with risk of schizophrenia and bipolar disorder(与精神分裂症和双相性精神障碍的风险相关的常见遗传变异))jPWei等,PLoS Genet.(2009)5(10):el000678.Epub20090ct9 (I 型糖尿病)。Tufts-New England Medical Center(Boston)的 Johanna M.Seddon, M.D.,Sc.M.及同事评估了某些遗传变体是否对于进展为晚期AMD及相关视力丧失具有预测的重要性,并且在Seddon等,JAMA(2007) 297 =1793-1800中报道了它们的发现。该研究包括了老年性眼病研究(AREDS)中的1,466名白人参与者,AREDS是一项美国多中心临床试验,其在1990至2001之间进行,平均随访时间为6.3年。在该研究期间,281名参与者的一只眼或两眼进展为晚期AMD,其包括:地图状萎缩(geographic atrophy)(导致视网膜变薄和变色),渗出性疾病(液体、细胞和细胞碎片从血管中溢出),或AMD导致的视力丧失。基于基因分型分析,基因CFH和L0C387715中的常见多态性被鉴定为独立地相关于从AMD的早期(玻璃疣和色素变质(alteration))到导致视觉缺陷或失明的AMD的晚期形式(地图状萎缩或新生血管AMD)的AMD进展。研究者发现,遗传多态性,CFH Y402H和L0C387715A69S,与进展为更晚期AMD相关,其中在对与AMD相关的其他因素进行控制后对于CFH进展的风险2.6倍更高而对于L0C387715风险基因型进展的风险4.1倍更高。进展的概率对于更高风险基因型是百分之48,而对低危基因型是百分之5。所有不利因素(两个风险基因型,吸烟以及25以上的体重指数)的存在使风险增加19倍。在每种风险基因型中,吸烟和高的体重指数都使进展的概率增加。同一课题组报道了随后的研究结果,该研究调查了遗传、眼睛和环境变量的联合作用以及AMD流行和发病的预测模型。(Seddon等,Investigative Ophthalmology &Visual Science (2009) 50:2044_53。作者发现六个遗传变体(CFH Y402H ;CFH rsl410996 ;L0C387715A69S(ARMS2) ;C2 E318D ;CFB ;C3 R102G)与晚期 AMD 流行和发病的独立相关。根据作者所述,在对基线AMD级别和其他因素进行控制后,除了 CFB,所有这些变体与进展为晚期AMD显著相关。确定的是,遗传、人口学(例如年龄、性别)和环境(例如吸烟)因素都促进AMD的发生和进展,其中遗传因素包括单核苷酸多态性(SNP)、拷贝数变体(CNV)和表观遗传变体,其与DNA甲基化或组蛋白修饰相关。然而,这些因素的相对作用,包括每种类型的遗传变异对疾病风险或进展的作用,还是未知的。因此,需要更好的理解和工具以预测发生AMD的可能性,或者对于已被诊断患有AMD的患者,预测其病症进展的风险。发明概述本发明至少部 分基于以下认识:数千种具有适度作用规模的常见遗传变体促进中期AMD到晚期AMD的进展,并且当集合时,多基因计分可以说明并预测从中期AMD进展到晚期AMD的风险。在一方面中,本发明涉及用于评估人受试者发生晚期老年性黄斑变性(AMD)的风险的方法,所述方法包括确定在来自所述受试者的生物样品中在多个独立基因座处是否存在与AMD相关的常见等位变体的风险等位基因。在一个实施方案中,评估的风险等位基因不包括补体rsl0737680和rsl329424 (补体因子 H) ;rs2285714 (补体因子 I) ;rs429608 和 rs9380272 (补体 C2),rs3793917 (HTRAl);和 rs2230199 (补体 C3)。在一个具体实施方案中,在确定是否存在风险等位基因之后是计算受试者的多基因计分,其中高的多基因计分指示发生晚期AMD的更高风险。在多个实施方案中,在至少20,或至少50,或至少100,或至少200,或至少500,或至少750,或至少1000,或至少1500,或至少2000,或至少2500,或至少3000,或至少3,500,或至少4,000,或至少4,500,或至少5,000,或至少5,500,或至少6,000,或至少6,500,或至少7,000,或至少7,500,或至少8,000,或至少8,500,或至少9,000,或至少9,500,或至少10,000个独立基因座处确定等位频率。在另一个实施方案中,所述受试者已经被诊断患有早期AMD。在另一个实施方案中,所述受试者已经被诊断患有中期AMD。在另一个实施方案中,所述方法还包括评估受试者的个人历史的一个或多个方面,如,例如,以下中的一个或多个:年龄、种族、体重指数、饮酒史、吸烟史、锻炼史、饮食、AMD或其他老年性眼病的家族史,包括亲属在其被诊断时的年龄,以及AMD治疗的个人历史。在另一个实施方案中,确定是否存在风险等位基因通过扩增来自所述样品的核酸实现。在多个实施方案中,扩增可以包括PCR,扩增可以是在芯片上,其中用于扩增的引物对所测试的常见遗传变体的等位基因是特异性的。在一个具体实施方案中,所述扩增包括:(i)将扩增引物或扩增引物对与分离自生物样品的核酸模板混合,其中所述引物或引物对与邻近或包含多态性的区域互补或部分互补,并且能够通过聚合酶在核酸模板上起始核酸聚合;以及,b)在包含聚合酶和模板核酸的DNA聚合反应中延伸引物或引物对从而生产扩增子。所述扩增子可以,例如,通过包括以下一种或多种的方法检测到:将扩增子杂交到阵列,利用限制性酶消化扩增子,或实时PCR分析。在另一个实施方案中,所述扩增包括使用分离自生物体或生物样品的核酸作为PCR, RT-PCR或LCR中的模板进行聚合酶链反应(PCR),反转录酶PCR(RT-PCR),或连接酶链反应(LCR)。在另一个实施方案中,所述方法还可以包括切割扩增的核酸。另一个实施方案,所述生物样品来源于体液,如唾液或血液。在其他实施方案中,所述方法还包括以下步骤:决定受试者的AMD诊断测试的时机和/或频率和/或决定受 试者的AMD治疗的时机和/或频率。在另一个实施方案中,所述方法还包括对被鉴定为具有增加的发生晚期AMD风险的受试者进行AMD治疗的步骤,其中所述治疗可以,例如,包括给予选自由以下组成的组的药物:抗因子D抗体,抗VEGF抗体,CRIg和CRIg-1g融合体。在另一个实施方案中,所述方法包括对于表SI中所列的所有单核苷酸多态性确定是否存在风险等位基因,并且基于该确定计算多基因计分。在另一个实施方案中,所述方法还包括在计算机可读介质上记录所述确定的结果的步骤。在另一个实施方案中,所述结果被传达给受试者或者受试者的医生和/或以报告的形式被记录。在另一方面中,本发明涉及包含本文中的方法的结果的报告。附图简述本专利的文件含有至少一幅彩图。在请求并支付必要费用后,具有彩图的本专利或专利申请的复件将由局方(Office)提供。
图1:已知的能够预测进展的AMD风险基因的能力。图2:多基因计分识别处于更高风险进展为晚期AMD的个体。图3:不依赖于基线临床计分,多基因计分识别处于更高风险进展为晚期AMD的个体。表SI:16, 617个SNP的列表。CHR =染色体;SNP = SNP ID ;BP =物理位置(碱基对);A1 =第一(次要)等位基因编码;F_A-病例(case)中的等位基因I频率;F_U:对照例(control case)中的等位基因频率;A2 =第二(主要)等位基因编码;CHISQ =卡方值;P = P值(病例/对照关联检验的显著性值);0R =与AMD风险相关的比值比。在一些情况中,次要等位基因与风险相关(0R> I)而在一些情况中,主要等位基因与AMD风险相关(OR < I)。发明详述1.定义当在本文中使用商品名时,申请人意在独立地包括商品名产品制剂、一般药物和商品名产品的活性药物成分。除非另外说明,以下术语和短语当在本文中使用时意在具有以下含义:术语"补体相关眼病"被最广义地使用并且包括所有这样的眼病,所述眼病的病理学涉及补体,包括经典途径和旁路途径,并且尤其是补体的旁路途径。补体相关眼病包括但不限于,黄斑变性疾病,如所有阶段的老年性黄斑变性(AMD,age-relatedmacular degeneration),包括干性和湿性(非渗出性和渗出性)形式,脉络膜新生血管形成(choroidal neovascularization) (CNV),葡萄膜炎(uveitis),糖尿病性视网膜病和其他缺血相关的视网膜病,以及其他眼内新生血管疾病,如糖尿病性黄斑水肿(diabeticmacular edema),病理性近视(pathological myopia) , von Hippel-Lindau 病,眼睛的组织胞浆菌病(histoplasmosis),视网膜中央静脉阻塞(Central Retinal Vein Occlusion)(CRVO),角膜新生血管形成(corneal neovascularization),和视网膜新生血管形成。一组优选的补体相关眼病包括老年性黄斑变性(AMD),包括非渗出性(湿性)和渗出性(干性或萎缩性)AMD,脉络膜新生血管形成(CNV),糖尿病性视网膜病(DR),和眼内炎(endophthalmitis)。在本文中使用术语“老年性黄斑变性”或“AMD”以包括所有阶段的AMD,包括2类(早期),3类(中期)和4类(晚期)AMD。"治疗"是为了防止疾病发生或改变疾病病理学而进行的干预。因此,"治疗"是指治疗性处理和预防性或防止性措施。需要治疗的人包括已经患有疾病的人以及要防止其患病的人。在补体相关眼病、如AMD的治疗中,治疗剂可以直接地有益地改变疾病的程度、严重性、进展或症状,或使疾病更易于通过其他治疗剂治疗。疾病如包括AMD在内的补体相关眼病的"病理学",包括损害患者健康的所有现象。这包括但不限于,与疾病的不同阶段相关的形态学,如在一只或双眼中玻璃疣的出现、数量和大小,积累基底层状沉淀(basal laminar deposits) (BLamD)和基底线状沉淀(basal linear deposits) (BLinD),色素变化,地图状萎缩(GA)和视网膜色素上皮(RPE)改变,视网膜中心区域中的感光细胞和支持组织的破坏(晚期干性形式),或视网膜下的异常和易碎血管(湿性形式);生理学变化,如受损的视力,部分或完全视力丧失。当在本文中使用时,术语"哺乳动物"是指被分类为哺乳动物的任何动物,包括但不限于,人,高等灵长类,家养和农场动物,以及动物园、体育或宠物动物如马、猪、牛、狗、猫和雪貂等。在本发明的优选的实施方案中,哺乳动物是人或另一种高等灵长类。"结合"一种或多种其他治疗剂给药包括同时(共同)和以任何次序相继给药。"表型"是可以在个体或群体中观察到的性状或性状的集合。性状可以是数量的(数量性状,或QTL)或定性的。例如,对AMD的易感性是可以根据本文中的方法、组合物、试剂盒和系统监测的表型。" AMD易感性表型"是个体中显示易发生AMD的体质的表型。显示易患AMD的体质的表型,可以,例如,显示:在给定的一组环境条件(饮食、身体运动状态、地理位置等)下,与相关一般群体的成员相比AMD将更有可能在具有该表型的个体中发生。“种族”可以是基于自我证实(自己报告),但是我们优选地是基于使用全基因组SNP数据以确定样品如何相关,以及将样品与来自Human HapMap项目的参比群体相比以确定种族。包括在HapMap中的群体有尼日利亚伊巴丹(Ibadan, Nigeria)的约鲁巴人(Yoruba)(简写:YRI);日本东京的日本人(简写JPT);中国北京的汉族人(简写:CHB);和 CEPH(Centre d' Etude du Polymorphisme Humain (人类多态性研究中心))(具有来自北欧和西欧的祖先的犹他居民)(简写:CEU)。主成分方法(principal componentsapproach)使用基因型数据以评估可以被解释为描述个体群组内的连续祖先异质性的变化轴(axes of variation) 0这些变化轴被定义成在研究群体中的个体之间的协方差矩阵的顶部特征向量(top eigenvector) 0然后,可以对于可归因于沿每个轴的祖先的关联性调整基因型和表型之间的关联。典型地,属于明显异常值的样品(相对于目的群体)被排除在分析之外从而对群体分层进行控制。具体地,来自整个基因组的基因型被用于计算特征向量(主成分分析(PCA)的一种形式),然后基于初级特征向量来分析样品。除去极端异常值(sigma >6),并且使用前5个特征向量作为协变量来修正关联结果。同样JAL Price, A.L.等 Principal components analysis corrects for stratification ingenome-wide association studies (用于全基因组关联研究中的分层的主成分分析修正) Nat.Genet.38,904-909 (2006),和实施例。"多态性"是可变的基因座;即,在群体内,在多态性处的核苷酸序列具有超过一种形式或等位基因。术语"等位基因"是指存在或被编码在特定基因座处的两种以上不同核苷酸序列中的一个,或由所述基因座编码的两种以上不同多肽序列。例如,第一等位基因可以存在于一个染色体上,而第二 等位基因存在于第二同源染色体上,例如,当存在于杂合个体的不同染色体时,或当存在于群体中不同的纯合或杂合个体之间时。多态性的一个实例是"单核苷酸多态性"(SNP),其是在基因组中单个核苷酸位置处的多态性(在指定位置处的核苷酸在个体或群体之间变化)。当等位基因与性状相联系并且当等位基因的存在指示性状或性状形式将在包含该等位基因的个体中发生时,等位基因"正"相关于性状。当等位基因与性状相联系并且当等位基因的存在指示性状或性状形式将不在包含该等位基因的个体中发生时,等位基因负相关于性状。当其可以在统计学上与表型相联系(正或负)时,标记多态性或等位基因与指定表型(例如AMD易感性等)"相关"或"相关联"。即,相比于在对照群体(例如,不具有乳腺癌的个体)中,指定的多态性更普遍地发生于病例(case)群体(例如,AMD患者)中。该相关性通常被推断为是性质上的原因,但是其不必需如此-表型之下对于性状基因座的简单遗传连锁(关联)足以产生相关性/关联性。"有利(favorable)等位基因"是在特定基因座处、正相关于所需表型(例如,对AMD的抗性)的等位基因,例如,与易患AMD的体质负相关的等位基因。有利等位基因的连锁标记是与所述有利等位基因一起分离的标记等位基因。有利等位形式的染色体片段是这样的染色体片段,其在物理上位于该染色体片段上的一个或多个遗传基因座处包括与所需表型正相关的核苷酸序列,或与不利表型负相关的核苷酸序列。"不利等位基因"是在特定基因座处、与所需表型负相关或与不想要的表型正相关(例如,与乳腺癌易感性的正相关性)的等位基因。不利等位基因的连锁标记是与所述不利等位基因一起分离的标记等位基因。不利等位形式的染色体片段是这样的染色体片段,其在物理上位于该染色体片段上的一个或多个遗传基因座处包括与所需表型负相关的核苷酸序列,或与不利表型正相关的核苷酸序列。“风险等位基因”是这样的等位基因,其与发生疾病或病症(如AMD)的风险正相关,即指示个体具有增加的发生AMD或进展为更晚期的AMD的可能性。基于大量(通常为数千种)常见遗传变体,“多基因计分”用于定义个体发生疾病或进展为更晚期疾病的风险,所述常见遗传变体每个对疾病或其进展可能具有适度个体作用规模的贡献,但是集合在一起,其具有显著的预测值。在本案中,用于预测患者进展为晚期AMD的可能性的多基因计分使用与AMD关联的常见单核苷酸多态性(SNP)。来自发现数据组中达到P < 0.1的每个变体的比值比(OR)的对数被用于计算多基因计分。具体地,对于计分中所用的10,617个变体中的每个,比值比的对数乘以个体携带的参比等位基因数目(0、1或2)。所得的总数除以每个个体中测试变体的数目,得到最终的多基因计分。根据本发明,“高多基因计分”用于指多基因计分>.0001,“低多基因计分”用于指多基因计分<.0001,而这两个阈值之间的多基因计分被定义为“中等多基因计分”。"等位基因频率"是指等位基因在个体内、种系内或种系的群体内的基因座处出现的频率(比例或百分比 )。例如,对于等位基因"A",基因型"AA"、" Aa"或"aa"的二倍体个体可以分别具有2、1或0的等位基因频率。种系或群体(例如,病例或对照)内的等位基因频率可以通过平均来自所述种系或群体的个体的样品的等位基因频率来评估。类似地,种系的群体内的等位基因频率可以通过平均构成所述群体的品系的等位基因频率来计算。如果个体在给定的基因座处仅具有一种类型的等位基因(例如,二倍体个体在两个同源染色体中的每个的基因座处具有一份相同的等位基因),则个体是"纯合的"。如果超过一种等位基因类型存在于给定的基因座处(例如,二倍体个体具有两个不同等位基因中的每个的一份拷贝),则个体是"杂合的"。术语"同质性"指示组中成员在一个或多个具体基因座处具有相同的基因型。相反,术语"异质性"用于指示组内的个体在一个或多个具体基因座处基因型不同。"基因座"是染色体位置或区域。例如,多态性基因座是多态性核酸、性状决定子、基因或标记所在的位置或区域。在另一个实例中,"基因座"是物种基因组中的特定染色体位置(区域),其中可以发现特定基因。类似地,术语"数量性状基因座"或"QTL"是指具有至少两个等位基因的基因座,所述至少两个等位基因,在至少一个遗传背景中,例如,在至少一个群体或后代中,差异性地影响数量或连续表型性状的表达或改变数量或连续表型性状的变异。"标记"、"分子标记"或"标记核酸"是指当鉴定基因座或连锁基因座时用作参考点的核苷酸序列或其编码的产物(例如,蛋白质)。标记可以来源于基因组核苷酸序列或表达的核苷酸序列(例如,RNA、nRNA、mRNA、cDNA等),或编码的多肽。该术语还指与标记序列互补或在标记序列侧翼(flanking)的核酸序列,如用作探针的核酸或能够扩增标记序列的引物对。"标记探针"是可以用于鉴定标记基因座的存在的核酸序列或分子,例如,与标记基因座序列互补的核酸探针。当它们在溶液中例如,根据Watson-Crick碱基配对原则特异性杂交时,核酸是"互补的"。"标记基因座"是可以用于追踪第二个连锁基因座的存在的基因座,例如,编码或促进表型性状的群体变异的连锁或相关的基因座。例如,标记基因座可以用于监测其在遗传上或物理上与标记基因座连锁的基因座(如QTL)处等位基因的分离。因此,"标记等位基因",备选地"标记基因座的等位基因"是在对标记基因座具有多态性的群体中的标记基因座处发现的多个多态性核苷酸序列中的一个。在一方面中,本发明提供与目的表型(例如,增加患有中期AMD的个体进展为晚期AMD的可能性的表型)相关的标记基因座。对应于群体成员间的遗传多态性的标记可以通过本领域中良好确立的方法检测。这些方法包括,例如,基于PCR的序列特异性扩增方法,检测限制性片段长度多态性(RFLP),检测同工酶标记,检测等位基因特异性杂交(ASH),检测单核苷酸延伸,检测基因组扩增的可变序列,检测自我维持序列复制,检测简单序列重复(SSR),检测单核苷酸多态性(SNP),或检测扩增片段长度多态性(AFLP)。"基因型"是个体(或个体的群组)在一个或多个遗传基因座处的遗传构成。基因型由个体的一个或多个已知基因座的等位基因,典型地,遗传自其亲本的等位基因的汇编(compilation)限定。"单体型"是个体在单个DNA链上的多个遗传基因座处的基因型。典型地,由单体型描述的遗传基因座在物理上和遗传上连锁,即,在相同的染色体链上。一"组"标记或探针是指标记或探针(或来源于其的数据)的集合或组,其被用于常见目的,例如,鉴定具有指定表型(例如,AMD易感性,或发生晚期AMD的易感性)的个体。通常,对应于标记或探针或源自其应用的数据存储在电子介质中。虽然一组中的每个成员具有关于指定目的的效用, 但是选自该组的个体标记以及包括一些但不是全部标记的亚组也可以有效地实现指定目的。"计算机可读介质"是可以通过计算机使用可用的或用户界面访问的信息存储介质。实例包括存储器(例如,ROM或RAM,闪存等),光存储介质(例如,⑶-ROM),磁存储介质(例如,计算机硬盘驱动器、软盘等),穿孔卡和可用且本领域技术人员已知的许多其他介质。信息可以在目的系统和计算机之间传输,或传输到或传输自计算机,传输到或传输自用于存储或访问存储的信息的计算机可读介质。该传输可以是电传输,或者可以通过其他可用方法方法如IR连接、无线连接等进行。术语"因子D"和"补体因子D"可互换地使用,并且是指天然序列和变异的因子D多肽。"天然序列"因子D,是与来源于天然的因子D多肽具有相同的氨基酸序列的多肽,而不管其制备方式。因此,天然序列因子D可以分离自自然或可以通过重组和/或合成方式制备。除了成熟因子D蛋白如成熟人因子D蛋白以外,术语"天然序列因子D",具体地包括因子D的天然存在的前体形式(例如,无活性的前体蛋白(preprotein),其被蛋白水解切割从而产生活性形式),因子D的天然存在的变体形式(例如,可变剪接形式)和天然存在的等位变体,以及与来源于天然的因子D多肽具有相同的氨基酸序列的因子D分子的结构构象变体。包括高等灵长类和非人哺乳动物在内的非人动物的因子D多肽特别地包括在该定义中。"因子D变体"或"补体因子D变体"是指如下所定义的活性因子D多肽,其与天然序列因子D多肽具有至少约80%的氨基酸序列同一性。通常,因子D变体与成熟因子D多肽具有至少约80%的氨基酸序列同一性,或至少约85%的氨基酸序列同一性,或至少约90%的氨基酸序列同一性,或至少约95%的氨基酸序列同一性,或至少约98%的氨基酸序列同一性,或至少约99%的氨基酸序列同一性。优选地,最高程度的序列同一性发生在因子D的活性位点内。在人因子D序列中,因子D的"活性位点"由His-57、Asp-102和Ser_195(胰凝乳蛋白酶原编号)限定。因子D在主要特异性口袋的底部具有Aspl89(胰凝乳蛋白酶编号)并且切割Arg肽键。催化三联体由His-57、Asp-102和Ser-195组成。与其他丝氨酸蛋白酶相比,Asp-102和His57显不非典型构象(Narayana等,J.Mol.Biol.235 (1994),695-708)。在SI 口袋的底部在Aspl89和Arg218之间观察到独特的盐桥,其提升环214-218并产生深且窄的I 口袋(Jinget等,J.Mol.Biol.282 (1998) 1061-1081)。通过突变分析,该环和活性位点附近的数个其他残基显示为是因子D酯水解活性的关键结构决定子(Kim等,J.Biol.Chem.270 (1995) 24399-24405)。基于这些结果,提出:在与C3b结合因子B结合后,因子D可以进行构象变化,导致蛋白水解活性的表达(Volanakis和Narayana,ProteinSc1.5(1996)553-564)。当在本文中使用时,术语“VEGF”或“VEGF”是指165个氨基酸的人血管内皮细胞生长因子及相关的121个、189个和206个氨基酸的人血管内皮细胞生长因子,如Leung等科学(Science),246: 1306 (1989);和 Houck 等分子内分泌学(Mol.Endocrin.), 5:1806 (1991),所记载的,及其天然存在等位基因形式和加工形式。术语"VEGF"还指来自非人物种如小鼠、大鼠或灵长类的VEGF。有时,来自特定物种的VEGF用如下术语表示,诸如hVEGF表示人VEGF,mVEGF表示鼠VEGF,等等。术语“VEGF”还用于指包含165个氨基酸的人血管内皮细胞生长 因子的氨基酸第8-109位或第1-109位的多肽的截短形式。在本申请中可通过例如"VEGF(8-109)〃," VEGF (1-109)"或"VEGF.sub.165"表示对任何此类形式的VEGF的引述。“截短的”天然VEGF的氨基酸位置如天然VEGF序列中所示的编号。例如,截短的天然VEGF中的第17位氨基酸(甲硫氨酸)也是天然VEGF中的第17位(甲硫氨酸)。截短的天然VEGF具有与天然VEGF相当的对KDR和Flt-1受体的结合亲和力。术语"VEGF变体"用于本文时是指在天然VEGF序列中包括一个或多个氨基酸突变的VEGF多肽。任选地,该一个或多个氨基酸突变包括氨基酸置换(一个或多个)。为了对本文描述的VEGF变体速记命名的目的,请注意数字是指根据推定的天然VEGF的氨基酸序列(在Leung等(同上)和Houck等(同上)中提供)的氨基酸残基位置。“百分比)氨基酸序列同一性”被定义为在进行序列比对(并在必要时导入空隙)以获取最大百分比序列同一性,且不将任何保守置换视为序列同一性的部分之后,候选序列中的氨基酸残基与参照因子D序列中的氨基酸残基相同的百分数。可使用本领域技术内的各种方法进行比对以确定百分比氨基酸序列同一性,例如,使用公众可得到的计算机软件如BLAST、BLAST-2、ALIGN或Megalign (DNASTAR)软件。本领域技术人员可以决定用于测量比对的适宜参数,包括在所比较的序列全长上实现最大比对所需的任何算法。然后相对于较长的序列计算序列同一性,即即使较短的序列与较长序列的部分显示100%序列同一性,整体序列同一性将低于100%。“百分比)核酸序列同一性”被定义为在进行序列比对(并在必要时导入空隙)以实现最大百分比序列同一性后,候选序列中的核苷酸与参照因子D编码序列中的核苷酸相同的百分数。可使用本领域技术内的各种方法进行比对以确定百分比核酸序列同一性,例如,使用公众可得到的计算机软件如BLAST、BLAST-2、ALIGN或Megalign (DNASTAR)软件。本领域技术人员可以决定用于测量比对的适宜参数,包括在所比较的序列全长上实现最大比对所需的任何算法。然后相对于较长的序列计算序列同一性,即即使较短的序列与较长序列的部分显示100%序列同一性,整体序列同一性将低于100%。“分离的”核酸分子是这样的核酸分子,其被鉴定并与至少一种污染性核酸分子分离,其与所述至少一种污染性核酸分子通常在所述核酸的天然来源中缔合。分离的核酸分子不同于其在自然界中被发现时的形式或环境。因此,分离的核酸分子不同于存在于天然细胞中的核酸分子。然而,分离的核酸分子包括包含在通常表达编码的多肽的细胞中的核酸分子,其中,例如,所述核酸分子存在的染色体位置与天然细胞的染色体位置不同。“分离的”编码因子D多肽的核酸分子是这样的核酸分子,其被鉴定并与至少一种污染性核酸分子分离,其与所述至少一种污染性核酸分子通常在编码因子D的核酸的天然来源中缔合。分离的编码因子D多肽的核酸分子不同于其在自然界中被发现时的形式或环境。因此,分离的编码因子D多肽的核酸分子不同于当其存在于天然细胞中时的编码核酸分子。然而,分离的编码因子D的核酸分子包括包含在通常表达因子D的细胞中的编码因子D的核酸分子,其中,例如,所述核酸分子存在的染色体位置与天然细胞的染色体位置不同。以最广义使用术语"拮抗剂",并且其包括能够中和、阻断、部分或全部抑制、消除、降低或干扰因子D生物学活性的任何分子。因子D拮抗剂包括但不限于,抗因子D抗体及其抗原结合片段,与因子D结合并能够中和、阻断、部分或全部抑制、消除、降低或干扰因子D活性(如因子D参与补体相关眼病尤其是AMD的病理学的能力)的其他结合多肽、肽和非肽小分子。"小分子"在本文中被定义为具有低于约600、优选低于约1000道尔顿的分子量。在因子D拮抗剂的语境中,"活性的"或"活性"或"生物学活性"是拮抗(部分或全部抑制)因子D的生物学活性的能力。优选的因子D拮抗剂的生物学活性是实现因子D相关疾病或病症、如例如补体相关眼病、尤其是AMD的状态例如病理学的可测改善的能力。可以在体外或体内测试(包括结合测定)中使用相关动物模型或人临床试验来测定活性。
术语"抗体"以最广义使用,并且具体包括但不限于,单个单克隆抗体(包括激动剂、拮抗剂和中和抗体)和具有多表位特异性的抗体组合物。术语"单克隆抗体"在本文中使用时是指从一群基本上同质的抗体中获得的抗体,即除了可能以少量存在的可能的天然存在的突变之外,构成群体的各个抗体是相同的。术语"单克隆抗体"在本文中使用时是指从一群基本上同质的抗体中获得的抗体,即除了可能以少量存在的可能的天然存在的突变之外,构成群体的各个抗体是相同的。单克隆抗体是高度特异性的,针对单个抗原位点。此外,与常规(多克隆)抗体制剂(其典型地包括针对不同决定簇(表位)的不同抗体)相比,每个单克隆抗体针对抗原上的单个决定簇。修饰语“单克隆”指示当从基本上同质的抗体群获得时抗体的特征,不应解释为要求通过任何特定方法来生产抗体。例如,根据本发明使用的单克隆抗体可以通过首先由Kohler等(1975)Nature256:495描述的杂交瘤方法制备,或者可以通过重组DNA方法(见,例如,美国专利号4,816,567)制备。例如,也可以使用在Clackson等(1991)Nature352:624-628和Marks等(1991) J.Mol.Biol.222:581-597中描述的技术,从噬菌体抗体文库中分离"单克隆抗体"。单克隆抗体在本文中具体地包括“嵌合”抗体(免疫球蛋白),其中重链和/或轻链的一部分与衍生自特定物种或属于特定抗体类别或亚类的抗体中的相应序列相同或同源,而链的剩余部分与衍生自另一物种或属于另一抗体类别或亚类的抗体中的相应序列相同或同源,以及此类抗体的片段,只要它们展现出期望的生物学活性(美国专利N0.4,816,567 ;和 Morrison 等(1984) Proc.Natl.Acad.Sc1.USA81:6851-6855)。非人(例如鼠)抗体的“人源化”形式是包含来源于非人免疫球蛋白的最小序列的嵌合抗体。对于大部分情况,人源化抗体是人免疫球蛋白(受体抗体),其中来自受体高可变区域的残基用来自具有所需特异性、亲合力和能力的非人物种(供体抗体)如小鼠、大鼠、兔或非人灵长类动物的高可变区域的残基替换。在有些情况中,将人免疫球蛋白的Fv构架区域(FR)残基用相应的非人残基替换。此外,人源化抗体可包含在受体抗体中或在供体抗体中没有发现的残基。进行这些修饰以进一步改进抗体的性能。一般而言,人源化抗体将包含基本上全部的至少一个、典型地两个可变结构域,其中所有或基本上所有高变环对应于非人免疫球蛋白序列的高变环,且所有或基本上所有FR区是人免疫球蛋白序列的FR区。人源化抗体还将任选包含至少一部分的免疫球蛋白恒定区(Fe),典型地是人免疫球蛋白的恒定区。进一步的细节请见 Jones 等(1986)Nature321:522-525 ;Riechmann 等(1988)Nature332:323-329 ;和 Presta(1992) Curr.0p.Struct.Biol.2:593_596。“物种依赖性抗体”是这样的抗体,其对于来自第一哺乳动物物种的抗原比其对于来自第二哺乳动物物种的该抗原的同源物具有更强的结合亲和力。正常地,该物种依赖性抗体“特异性地结合”至人抗原(即具有不超过大约1x10_7M,优选不超过大约1x10_8M且最优选不超过大约IxlO-9M的结合亲和力(Kd)值),但对来自第二非人哺乳动物物种的该抗原的同源物具有的结合亲和力比其对该人抗原的结合亲和力弱至少大约50倍,或至少大约500倍,或至少大约1000倍。物种依赖性抗体可以是上文定义的多种抗体类型的任何一种,但是优选是人源化抗体或人抗体。用于本文时,“抗体突变体”或“抗体变体”指抗体的氨基酸序列变体,其中所述抗体的一或多个氨基酸残基已经被修饰。这些突变体必然与参考抗体具有不足100%的序列同一性或相似性。在优选实施方案中,所述抗体突变体具有这样的氨基酸序列,其与参考抗体的重链或轻链可变结构域的氨基酸序列具有至少75%,更优选至少80%,更优选至少85%,更优选至少90%,并且最优选至少95%的氨基酸序列同一性或相似性。关于该序列的同一性或相似性在本文中被定义为:在进行序列比对(并在必要时导入空隙)来获得最大百分比序列同一性后,候选序列中的氨基酸残基与参考抗体残基相同(即相同残基)或相似(即来自基于共同的侧链性质的相同组的氨基酸残基)的百分比。N端、C端或内部延伸、缺失或插入可变结构域外的抗体序列都不应视为影响序列同一性或相似性。“分离的”抗体是已经从其天然环境的组分鉴定和分离和/或回收的抗体。其天然环境的污染组分是会干扰抗体的诊断或治疗用途的物质,并且可包括酶,激素,及其它蛋白质或非蛋白质的溶质。优选的实施方案中,将抗体纯化至,⑴如通过劳里方法(Lowrymethod)测定的超过95重量%的抗体,并且最优选超过99重量%,(2)通过使用转杯式序列分析仪(spinning cup sequenator)足够获得N端或内部氨基酸序列的至少15个残基的程度,或(3)通过SDS-PAGE在还原或非还原条件下使用考马斯蓝,或优选银染色,达到同质性(homogeneity)。分离抗体包括重组细胞内的原位抗体,因为所述抗体的天然环境中的至少一个组分将不存在。但是,一般分离的抗体将通过至少一步纯化步骤来制备。当在本文中使用时,“抗体可变区”指抗体分子的轻链和重链的部分,其包括互补决定区(⑶Rs:即⑶R1、⑶R2和⑶R3)和构架区(FRs)的氨基酸序列。重链的可变结构域。'指轻链的可变结构域。根据本发明所用方法,指定到CDRs和FRs的氨基酸位点可以根据Kabat来定义(免疫目的蛋白序列(Sequences of Proteins of ImmunologicalInterest),国家健康研究所(National Institutes of Health), Bethesda, Md.1987 和1991)。抗体或抗原结合片段的氨基酸编号也是根据Kabat编号。当在本文中使用时,术语“互补决定区” (OTRs:BP⑶R1,⑶R2和⑶R3)是指抗体可变结构域的氨基酸残基,其存在对于抗原结合是必需的。每个可变结构域通常具有鉴定为⑶R1XDR2和⑶R3的三个⑶R区。每个互补决定区可包含来自Kabat所定义的“互补决定区”的氨基酸残基(即大约为轻链可变结构域中的残基24-34 (LI),50-56 (L2)和89-97 (L3)以及重链可变结构域中的31-35 (Hl),50-65 (H2)和95-102 (H3) ;Kabat等,免疫目的蛋白序列(Sequences of Proteins of Immunological Interest),第 5 版 Public HealthService,国家健康研究所(National Institutes of Health), Bethesda, MD.(1991)和/或来自“高变环(hypervariable loop) ”的那些残基(即大致为轻链可变结构域中的残基 26-32 (LI) ,50-52 (L2)和 91-96 (L3),及重链可变结构域中的 26-32 (Hl),53-55 (H2)和96-101 (H3) ;Chothia 和 Lesk (1987) J.Mol.Biol.196:901-917)。有些情况下,互补决定区能包括来自根据Kabat定义的⑶R区和高变环的氨基酸。例如,抗体4D5的重链的⑶RHl包括氨基酸26-35。“构架区”(后文是FR)是⑶R残基之外的那些可变结构域残基。每个可变结构域通常具有鉴定为FR1,FR2,FR3和FR4的四个FR。如果所述⑶R根据Kabat来定义,轻链 FR 残基大致位于残基 1-23 (LCFRl),35-49 (LCFR2),57-88 (LCFR3),和 98-107 (LCFR4),并且重链FR残基大致位于重链残基的残基1-30 (HCFRl),36-49 (HCFR2),66-94 (HCFR3),和103-113 (HCFR4)。如果所述CDR包含来自高变环的氨基酸残基,轻链FR残基大致位于轻链中的残基 1-25 (LCFRl),33-49 (LCFR2),53-90 (LCFR3),和 97-107 (LCFR4),且重链 FR 残基大致位于重链残基的残基 1-25 (HCFRl),33-52 (HCFR2),56-95 (HCFR3),和 102-113 (HCFR4)。有些情况下,当CDR包含来自根据Kabat定义的CDR和高变环的那些氨基酸时,FR残基会相应调整。例如,当⑶RHl包括氨基酸H26-H35时,重链FRl残基在位点1_25且FR2残基在位点36-49。当在本文中使用时,“密码子组”是指用于 编码所需变体氨基酸的不同核苷酸三联体序列的组。可以通过例如固相合成来合成一组寡核苷酸,包括表示由密码子组提供的核苷酸三联体的所有可能的组合并且将编码所需的氨基酸组的序列。密码子指定的标准形式是IUB代码的形式,其在本领域中是已知的并且在本文中得到描述。密码子组通常由3个斜体的大写字母表示,例如NNK、NNS, XYZ、DVK等。因此当在本文中使用时,“非随机密码子组”是指编码部分(优选完全地)满足本文中所述的氨基酸选择标准的选定的氨基酸的密码子组。在本领域中,在特定位置具有选定的核苷酸“简并性”的寡核苷酸的合成是已知的,例如TRM方法(Knappek等(1999) J.Mol.Biol.(分子生物学杂志)296:57-86);Garrard & Henner (1993) Gene (基因)128:103)。可以使用商业核酸合成仪(例如可从Applied Biosystems, Foster City, Calif.获得)来合成或者在商业上获得(例如从LifeTechnologies, Rockville, Md.)这样一组具有特定密码子组的寡核苷酸。因此,合成的具有特定密码子组的一组寡核苷酸组通常将包括具有不同序列的多个寡核苷酸,所述不同由整个序列内的密码子组产生。如根据本发明使用的寡核苷酸具有这样的序列,其允许与可变结构域核酸模板杂交并且还可以包括(但不是必须包括)可用于例如克隆目的的限制性酶位点。术语"抗体片段"被最广义地用于本文中并且包括但不限于,Fab、Fab'、F{ah' )2、scFv、(scFv)2、dAb,和互补决定区(CTR)片段,线性抗体,单链抗体分子,微抗体(minibody),双抗体,和由抗体片段形成的多特异性抗体。“Fv”片段是包含完整的抗原识别和结合位点的抗体片段。此区域由一个重链的和一个轻链的可变区紧密连接的二聚体组成,该连接(如在scFv中)可以是共价性质的。在此构型中,每个可变结构域的三个CDR相互作用来定义Vh-'二聚体表面上的抗原结合位点。共同地,六个⑶R或其亚组(subset)赋予所述抗体以抗原结合特异性。然而,即使单一可变结构域(或仅包含三个对抗原特异的CDR的Fv的一半)也具有识别并结合抗原的能力,虽然通常与完整的结合位点相比其亲合力较低。“Fab”片段包括 轻链的可变结构域和恒定结构域以及重链的可变结构域和第一恒定结构域(CHI)。F(ab' )2抗体片段包含一对Fab片段,其通常在它们的羧基末端附近通过它们之间的铰链半胱氨酸来共价连接。抗体片段的其它化学偶联法也是本领域已知的。“单链Fv”或“scFv”抗体片段包含抗体的Vh和\结构域,其中这些结构域存在于单条多肽链中。一般而言,Fv多肽在Vh和\结构域之间还包含多肽接头,使得scFv形成期望的抗原结合结构。关于scFv的综述参见Pluckthun于The Pharmacology of MonoclonalAntibodies (单克隆抗体药理学),Vol.113, Rosenburg 和 Moore 编辑,Springer-Verlag,New York, pp.269-315(1994)。术语“双抗体(diabodies) ”是指带有两个抗原结合位点的小抗体片段,该片段包含在相同多肽链(Vh和')中连接到轻链可变结构域(')的重链可变结构域(Vh)。通过使用太短使得同一条链上的两个结构域之间不能配对的接头,迫使结构域与另一个链上的互补的结构域配对,并产生两个抗原结合位点。双抗体在例如EP 404, 097 ;W0 93/11161 ;和Hollinger 等(1993),Proc.Natl.Acad.Sc1.USA(美国国家科学院学报),90:6444-6448 中有更充分的描述。“线性抗体”的表述是指在 Zapata 等(1995Protein Eng, 8 (10) =1057-1062)中描述的抗体。简言之,这些抗体包含一对串联的Fd片段(Vh-Ch1-Vh-Chi),其与互补的轻链多肽一起形成一对抗原结合区。线性抗体可以是双特异性的或单特异性的。I1.详沭老年件昔斑夺件(AMD)老年性黄斑变性(AMD)是缓慢进展的退行性疾病,其最终将丧失中央视觉。取决于疾病的严重度,可以将AMD分为四类,所述四类具有在以下表I中列出的特征。表I
权利要求
1.用于评估人受试者发生晚期老年性黄斑变性(AMD)的风险的方法,所述方法包括: (a)确定来自所述受试者的生物样品中多个独立基因座处AMD相关的常见等位变体的风险等位基因的存在或不存在,和 (b)计算所述受试者的多基因计分, 其中,闻的多基因计分指不发生晚期AMD的更闻风险。
2.权利要求1的方法,其中在至少100,或至少500,或至少1000,或至少2500,或至少5,000,或至少7,500,或至少10,000个独立基因座处确定等位频率。
3.权利要求1的方法,其中所述受试者已经被诊断患有早期AMD。
4.权利要求1的方法,其中所述受试者已经被诊断患有中期AMD。
5.权利要求1的方法,所述方法还包括评估所述受试者的个人历史的一个或多个方面。
6.权利要求5的方法,其中所述一个或多个方面选自由以下各项组成的组:年龄、种族、体重指数、饮酒史、吸烟史、锻炼史、饮食、AMD或其他老年性眼病的家族史,包括亲属在其被诊断时的年龄,以及AMD治疗的个人历史。
7.权利要求1的方法,其中通过从所述样品扩增核酸来确定风险等位基因的存在或不存在。
8.权利要求7的方法,其中扩增包括PCR。
9.权利要求7的方法,其中用于扩增的引物位于芯片上。
10.权利要求9的方法,其中所述用于扩增的引物对所述常见遗传变体的等位基因具有特异性。
11.权利要求7的方法,其中所述扩增包括:(i)将扩增引物或扩增引物对与分离自所述生物样品的核酸模板混合,其中所述引物或引物对与邻近或包括多态性的区域互补或部分互补,并且能够利用聚合酶在所述核酸模板上起始核酸聚合;和,b)在包含聚合酶和所述模板核酸的DNA聚合反应中延伸所述引物或引物对以生成扩增子。
12.权利要求11的方法,其中所述扩增子通过包括以下一项或多项的方法检测:将所述扩增子杂交到阵列,利用限制性酶消化所述扩增子,或实时PCR分析。
13.权利要求7的方法,其中所述扩增包括使用分离自所述生物体或生物样品的核酸作为PCR、RT-PCR或LCR中的模板进行聚合酶链反应(PCR),反转录酶PCR (RT-PCR),或连接酶链反应(LCR)。
14.权利要求7的方法,所述方法还包括切割扩增的核酸。
15.权利要求7的方法,其中所述样品来源于唾液或血液。
16.权利要求1的方法,所述方法还包括以下步骤:决定对于所述受试者进行AMD诊断测试的时机和/或频率。
17.权利要求1的方法,所述方法还包括以下步骤:决定对于所述受试者进行AMD治疗的时机和/或频率。
18.权利要求1的方法,所述方法还包括以下步骤:对被鉴定为具有增加的发生晚期AMD的风险的受试者进行AMD治疗。
19.权利要求18的方法,其中所述治疗包括给予选自由抗因子D抗体、抗VEGF抗体、CRIg和CRIg-1g融合体组成的组的药物。
20.权利要求17的方法,其中所述治疗包括给予抗因子D抗体。
21.权利要求1的方法,其中对于在表I中列出的所有单核苷酸多态性,确定风险等位基因的存在或不存在。
22.权利要求21的方法,其中所述多基因计分根据所述确定进行计算。
23.权利要求1的方法,所述方法还包括以下步骤:在计算机可读介质上记录所述确定的结果。
24.权利要求23的方法,其中所述结果被传达给所述受试者或所述受试者的医生。
25.权利要求23的方法,其中所述结果被记录成报告的形式。
26.包含权利要求1的方法的结果的报告。
27.用于评估人受试者发生晚期老年性黄斑变性(AMD)的风险的方法,所述方法包括确定来自所述受试者的生物样品中多个独立基因座处AMD相关的常见等位变体的风险等位基因的存在或不存在。
28.权利要求27的方法,其中被评估的风险等位基因不包括补体rsl0737680和rsl329424 (补体因子 H) ;rs2285714 (补体因子 I) ;rs429608 和 rs9380272 (补体 C2),rs3793917 (HTRAl);和 rs2230199 (补体 C3)。
29.权利要求27或28的方法,所述方法还包括以下步骤:确定所述受试者的多基因计分。
30.权利要求29的方法,其中高的多基因计分指示所述受试者将发生晚期AMD的增加的可能性。`
全文摘要
本发明涉及用于鉴定具有更大风险进展为晚期老年性黄斑变性(AMD)的患有中期AMD的个体的方法,所述方法使用基于全基因组基因关联研究的结果计算的多基因计分,并且使用数千种单核苷酸多态性(SNP)。
文档编号C12Q1/68GK103201393SQ201180052312
公开日2013年7月10日 申请日期2011年11月1日 优先权日2010年11月1日
发明者蒂莫西·W·贝伦斯, 罗伯特·R·格雷厄姆 申请人:霍夫曼-拉罗奇有限公司