Alport综合征新的突变致病基因及其编码蛋白和应用的制作方法
【专利摘要】本发明通过外显子测序方法鉴定了与Alport综合征相关的两个致病基因的两个新发突变。具体地,发明人以两个ATS家系为研究对象,对这两个家系中的患病个体和非患病个体分别进行外显子组测序和比较,在其中一个家系的C0L4A4基因上发现移码缺失突变(c.3213delA,p.Lysl071fs*5),在另一个家系的C0L4A5基因上发现移码缺失突变(c.499delC,p.Prol67Glnfs*36),这两个移码缺失位点分别是这两个家系真正的致病位点。在此基础上,本发明提供了突变的C0L4A4基因和C0L4A5基因及其编码蛋白质和应用,包含突变的C0L4A4基因和/或C0L4A5基因的载体、宿主细胞以及试剂盒。利用该突变的C0L4A4基因和/或C0L4A5基因,可以对Alport综合征进行分子诊断和患病风险评价。这两个突变基因及其编码蛋白质还可作为治疗Alport综合征的药物革巴点。
【专利说明】Alport综合征新的突变致病基因及其编码蛋白和应用
【技术领域】
[0001] 本发明涉及一种人体变异的基因,尤其涉及一种Alport综合征新的突变致病基 因。本发明还涉及Alport综合征新的突变致病基因的编码蛋白质和应用,包含突变的 Alport综合征致病基因的载体、宿主细胞以及试剂盒。
【背景技术】
[0002] Alport综合征(Alport syndrome, ATS)是以家族性进行性出血性肾炎、眼疾和 耳聋为特征的一种遗传病,发病率约为1/5000。1927年,Alprot首次报道该病,家系中受 累患者表现为进行性血尿和耳聋,男性患者早年死于尿毒症,女性患者存活时间较长。ATS 首发症状一般为肾脏症状,儿童期表现为周期性镜下或肉眼血尿,男性患者比女性患者发 病早。其它症状还包括神经性耳聋和眼部疾病。典型病理改变为肾脏基底膜超微结构改 变(变薄、增厚和破裂),但疾病早期可能观察不到患儿肾脏的病理改变,给病理学快速 诊断带来一定难度。肾功能衰竭呈渐进性,约0. 3%?2. 3%的患者最终进展为末期肾病 (endstagerenal disease, ESRD)。X 连锁 ATS (X-linked ATS, XL-ATS)患者发生 ESRD 比例 较高,12%的女性患者在40岁之前发展为ESRD,30%的女性患者在60岁前发展为ESRD,而 男性患者几乎全部发展为ESRD。且大多数ATS患者存在耳聋症状。
[0003] ATS是一种单基因遗传病,由编码IV型胶原的基因突变引起。其致病基因包括 C0L4A3(the collagen of basement membrane, alpha_3chain gene)、C0L4A4 和 C0L4A5。 最常见的ATS为XL (X连锁,X-I inked),约占80 %,其次为AR (常染色体隐性遗传性, autosomal recessive),约占15%,还有少数患者呈AD(常染色体显性遗传性,autosomal dominant)〇
[0004] 常染色体隐性遗传性 ATS (autosomal recessive ATS, AR-ATS)由 C0L4A3 或 C0L4A4基因纯合或复合杂合突变引起。患者症状较严重,男女无明显区别,一般在30岁左 右发生ESRD。女性患者具有严重的临床表型,患者父母多为近亲结婚,男性患者的父亲存 在镜下血尿和免疫组化检测缺乏α 3- α 5标记。已发现至少47种C0L4A3基因突变和27 种C0L4A4基因突变与AR-ATS发病相关。常染色体显性遗传性ATS (autosomal dominant ATS, AD-ATS)较为罕见。共报道6个家系,3个由C0L4A3基因突变引起,3个由C0L4A4基因 突变引起。可表现为父到子遗传传递模式,该类型症状较轻,男女表现类似症状,ESRD和听 力损伤一般出现在50岁以后,无眼部疾病。X连锁显性遗传型ATS伴弥漫性平滑肌瘤患者 有发现C0L4A6及C0LA4A5基因突变,这种突变多为C0L4A6和C0LA4A5基因5'端的缺失, 导致肾小球及食管平滑肌瘤的基底膜的改变。
[0005] C0L4A4基因定位于染色体2q36_37,其包含48个外显子,长度从9bp至287bp不 等,其内含子、外显子的分界基本明确。ATS小鼠动物模型在插入了突变了的C0L4A3和 C0L4A4表现出与人类ATS -样的表型与超微结构。该基因编码IV型胶原的α 4链(1690 个氨基酸残基)。IV型胶原是构成基底膜的主要成分,由三条α链构成一个三螺旋分子, 两个IV型胶原分子以端端连接或端侧吻合/四个IV型胶原分子以侧侧吻合方式组成一个 网状结构,形成基底膜的支架。到目前为止,通过特异的免疫组化染色发现已发现6种不同 a链,分别称a I- α 6,而构成IV型胶原的6条α链在参与构成IV型胶原三股螺旋结构时 不一致,通常认为IV型胶原α?和α2链形成三股螺旋,构成一类IV型胶原网状结构;而 由IV型胶原α 3- α 6链形成的三股螺旋,将构成另一类IV型胶原网状结构。α 1和α 2 链广泛分布于几乎所有的基底膜,α 3、α 4和α 4链仅局限性分布于肾小球,内耳及眼部。 Boye等人通过PCR-SSCP法对31例来源于不同国家及地区的AR-ATS患者C0L4A4基因所有 外显子进行基因突变的检测,也发现移码突变、错义突变及连接点突变。Btlzza等也在该基 因不同部位发现错义突变。
[0006] C0L4A5基因位于Xq22. 3,长250kb,含51个外显子,编码1685个氨基 酸残基(α 5 (IV)链)。α 5 (IV)链由26个氨基酸信号肽、甘氨酸-X-Y三联结构 (Gly-Xaa-Yaa-repeat sequence, GXY)反复串联而成的胶原区(1430个氨基酸)和羧基端 非胶原区(carboxyl-terminal noncollagenous domain, NCl ; 229 个氨基酸)组成。NCl 区对启动IV型胶原三股螺旋结构的形成有重要的作用。目前已发现的C0L4A5基因突变超 过440种,不同地区和种族患者的基因突变不同,且不存在突变热点。绝大部分突变为遗传 性,也有10% -15%的突变是新发生的,提示该病存在很大的危害性。由于女性患者保留一 条正常X染色体,基因功能未完全丧失,而男性患者只存在一条异常X染色体,因此男性患 者一般比女性患者表现为更严重临床症状。
[0007] 最近,外显子组测序(exome sequencing)被成功地应用于发现稀有单基因疾病的 致病基因,如Freeman - Sheldon综合症的MYH3基因,Schinzel-Giedion综合征的SETBPl 基因,以及严重大脑畸形的WDR62突变等。全外显子测序技术已被证明为降低稀有单基因 疾病候选基因甚至发现其致病基因的有力、有效手段,仅通过对几个很少的个体(包括患 者及正常对照)的全外显子进行测序来筛选与疾病相关的变异,其成功率大为提升。
【发明内容】
[0008] 本发明的主要目的在于利用外显子组测序技术鉴别出Alport综合征致病基因新 的突变位点。在此基础上,提供Alport综合征新位点突变的致病基因及其编码蛋白质和应 用,包含Alport综合征新位点突变致病基因的载体、宿主细胞以及试剂盒,以对Alport综 合征进行分子诊断和患病风险评价,为进一步治疗该疾病提供设计药物的靶点,同时为阐 明该病的致病机制提供理论基础。
[0009] 因此,一方面,本发明提供了一种突变的C0L4A4基因,所述突变的C0L4A4基因序 列导致Alport综合征的发生,其基因序列如SEQ ID NO: 2所示。野生型的C0L4A4基因序 列如SEQ ID NO: 1所示,编码区具有5073个碱基,与野生型的C0L4A4基因序列相比,突变 的 C0L4A4 基因发生了移码缺失突变(c. 3213delA, p. Lysl071fs*5),即 SEQ ID NO: 1 中第 3213位的碱基A缺失了,只有5072个碱基,导致了第3213位后所有的碱基序列发生移码。 [0010] 第二方面,本发明还提供了 SEQ ID NO:2序列编码的蛋白质,由于突变的C0L4A4 基因在第3213位发生了移码缺失突变,导致其编码的氨基酸序列在第1071位后与野生型 的C0L4A4蛋白质氨基酸序列完全不同,且移码导致了终止密码子的出现,使得SEQ ID N0:2 序列编码的蛋白质翻译提前终止,突变的C0L4A4基因编码的蛋白质只有1139个氨基酸,其 氨基酸序列如SEQ ID N0:4所示。野生型的C0L4A4蛋白质序列有1690个氨基酸,其序列 如SEQ ID N0:3所示,比突变型的C0L4A4蛋白质序列更长。
[0011] 同时,本发明还提供了一种突变的C0L4A5基因,所述突变的C0L4A5基因序列导致 Alport综合征的发生,其基因序列如SEQ ID NO:6所示。野生型的C0L4A5基因序列如SEQ ID N0:5所示,编码区具有5058个碱基,与野生型的C0L4A5基因序列相比,突变的C0L4A5 基因发生了移码缺失突变(c. 499delC,p. Prol67Gln fs*36),即SEQ ID N0:5中第499位的 碱基C缺失了,只有5057个碱基,且导致了第499位后所有的碱基序列发生移码。
[0012] 同时,本发明还提供了 SEQ ID N0:6序列编码的蛋白质,由于突变的C0L4A5基因 在第499位发生了移码缺失突变,导致其编码的氨基酸序列在第167位以后与野生型的 C0L4A5蛋白质氨基酸序列完全不同,且移码导致了终止密码子的出现,使得SEQ ID N0:6序 列编码的蛋白质翻译提前终止,突变的C0L4A5基因编码的蛋白质只有201个氨基酸,其氨 基酸序列如SEQ ID N0:8所示。野生型的C0L4A5蛋白质序列有1685个氨基酸,其序列如 SEQ ID N0:7所示,比突变型的C0L4A5蛋白质序列长很多。
[0013] 第三方面,本发明还提供了含有上述突变的C0L4A4基因和/或突变的C0L4A5基 因的载体。
[0014] 第四方面,本发明还提供了被上述载体转化或转导的宿主细胞或者被上述突变的 C0L4A4基因和/或突变的C0L4A5基因直接转化或转导的宿主细胞。
[0015] 第五方面,本发明还提供了上述突变的C0L4A4基因和/或突变的C0L4A5基因在 用作治疗Alport综合征的药物祀点或制备Alport综合征诊断试剂盒中的应用。
[0016] 第六方面,本发明还提供了 一种用于诊断Alport综合征的试剂盒,所述试剂盒包 含能够特异性扩增上述突变的C0L4A4基因和/或如突变的C0L4A5基因的引物,或能够特 异性检测上述突变的C0L4A4基因和/或突变的C0L4A5基因的探针。
[0017] 在一个优选的实施方案中,所述引物包括上游引物5'-GGATTTCCAGGGACACCAG-3', 下游引物 5' -TGTAATAGCCAAGACCTGAAGACA-3' ;和 / 或上游引物 5, -TGAATCTTCAGATCATTTTTCTGG-3,,下游引 5, -GAGGGATTGTTGTAATCTTCTGG-3,。
[0018] 第七方面,本发明还提供了一种抗体,所述抗体与上述突变的C0L4A4基因编码的 突变C0L4A4蛋白质特异性结合,且不作用于野生型C0L4A4基因所编码的蛋白质。
[0019] 同时,本发明还提供了一种抗体,所述抗体与上述突变的C0L4A5基因编码的突变 C0L4A5蛋白质特异性结合,且不作用于野生型C0L4A5基因所编码的蛋白质。
[0020] 第八方面,本发明还提供了 Alport综合征治疗剂,所述治疗剂包含了上述两种抗 体中的至少一种。
[0021] 本发明通过外显子组测序技术鉴定了与Alport综合征相关的两个致病基因的两 个新发突变。一方面,通过检测受试者是否携带有这两个致病基因的两个新发突变,可以早 期筛查Alport综合征致病突变基因携带者,提供优生优育指导;也可为Alport综合征患 者提供分子诊断依据。特别地,本发明所提供的诊断试剂盒可用于快速、有效地预测或诊 断Alport综合征。另一方面,本发明为Alport综合征的发病机制研究奠定了重要基础,为 Alport综合征患者的治疗提供全新的理论依据。第三方面,本发明可以为治疗Alport综合 征提供可能的药物靶点。
【专利附图】
【附图说明】
[0022] 图1是某四代Alport综合征家系1图,其中正方形表示男性,圆圈表示女性;带斜 线为死亡,实心为患病个体,空心为正常个体;N/N表示normal,即正常个体,N/M表示携带 有C0L4A4c. 3213delA突变的杂合个体,即患者。
[0023] 图2是某四代Alport综合征家系2图,其中正方形表示男性,圆圈表示女性;带斜 线为死亡,实心为患病个体,空心为正常个体;N/N表示normal,即正常个体,N/M表示携带 有C0L4A5c. 499delC突变的杂合个体,即患者。
[0024] 图3为移码缺失突变C0L4A4基因(c. 3213delA, P. Lysl071fs*5)序列分析示意 图,箭头指示C0L4A4基因中缺失突变的新位点c. 3213delA(p. Lysl071fs*5),上部分为家 系1正常人(111:1)测序峰图,下部分为家系1患者杂合c.3213delA突变(111:7)测序峰 图,箭头指示C0L4A4基因中缺失突变的新位点c. 3213delA,(p. Lysl071fs*5)。
[0025] 图4为移码缺失突变C0L4A5基因(c. 499delC, p. Prol67Gln fs*36)序列分析示意 图,箭头指示C0L4A5基因中缺失突变的新位点c. 499delC (p. Pr〇167Gln f s*36),上部分为 家系2正常人(11:2)序列图,下部分为家系2患者杂合c.499delC突变(IV :1)序列图。
【具体实施方式】
[0026] 以下结合实施例对本发明进行更为详细的描述,但是以下描述仅用于对本发明进 行解释性说明,并不对本发明的保护范围进行任何的限制,本发明的保护范围以权利要求 书限定的范围为准。
[0027] 在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术 人员所通常理解的含义。并且,本文中所用的分子遗传学、核酸化学和分子生物学相关术语 和实验室操作步骤均为相应领域内广泛使用的术语和常规步骤。同时,为了更好地理解本 发明,下面提供相关术语的定义和解释。
[0028] 在本发明中,术语"外显子"是指在成熟mRNA中被保留下的部分,即成熟mRNA对 应于基因中的部分。内含子是在mRNA加工过程中被剪切掉的部分,在成熟mRNA中不存在。 外显子和内含子都是对于基因而言的,编码的部分为外显子,不编码的为内含子,内含子没 有遗传效应。
[0029] 在本发明中,术语"外显子捕获"与"芯片杂交"可互换使用,指的是探针对文库中 外显子区域的DNA片段进行特异性选择和结合的过程。DNA分子正常情况下是双链,因此捕 获之前,DNA分子必须变为单链,一般是通过加热使其变性而达到解链目的,解链的DNA分 子被迅速冷却,即保持单链状态。文库变性后在杂交平台与芯片进行捕获杂交。含有外显 子区域的DNA片段与固定在芯片上的探针之间在严格的条件下进行分子杂交。较佳地,芯 片上探针分子的浓度要远远高于靶分子浓度。待杂交完毕后,通过变性等方法收集捕获的 序列并纯化,得到来自捕获后的序列混合物。
[0030] 在本发明中,"高通量测序"是指采用三种第二代测序平台进行高通量测序: 454FLX(Roche 公司)、Solexa Genome Analyzer(Illumina 公司)和 Applied Biosystems 公司的SOLID等。这些平台共同的特点是极高的测序通量,相对于传统测序的96道毛细管 测序,高通量测序一次实验可以读取40万到400万条序列,根据平台的不同,读取长度从 25bp到450bp不等,因此不同的测序平台在一次实验中,可以读取IG到14G不等的碱基数。
[0031] 在本发明中,术语"DNA文库"是指对基因组的目的片段进行打断,获得一组具有一 定大小的DNA片段混合物。DNA文库的制备方法为本领域技术人员所熟知。在一个优选例 中,还可以对打断产物、末端修复产物、接头产物和富集产物进行纯化。对反应的条件进行 一定的变化或优化也在本领域技术人员能力范围之内。
[0032] 在本发明中,术语"突变"是指野生型的C0L4A4基因和/或C0L4A5基因多核苷酸 序列发生改变,成为变异体,变异体可以是天然发生的或非天然发生的。
[0033] 本发明还涉及与所述的突变的C0L4A4基因或C0L4A5基因杂交且两个序列之间具 有至少80 %,较佳地至少90 %,更佳地至少95 %,至少99 %同源性的多核苷酸。本发明特 别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。
[0034] 本发明野生型或突变的C0L4A4基因或C0L4A5基因核苷酸全长序列或其片段通常 可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开 的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技 术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。一旦获得了有关的 序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞, 然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
[0035] 本发明中,"载体"包括但不限于克隆载体和表达载体。在一个优选的实施方案中, 所述载体是例如质粒,粘粒,噬菌体,柯斯质粒等等。在一个优选的实施方案中,所述载体是 商购可得的。在一个优选的实施方案中,所述载体包含与上述突变的C0L4A4基因或C0L4A5 基因可操作地连接的表达控制序列,例如但不限于启动子,增强子和终止子。在一个优选的 实施方案中,所述载体任选地还包含选择标记。
[0036] 包含上述适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当 的宿主细胞,以使其能够表达蛋白质。此类宿主细胞包括但不限于,原核细胞例如大肠杆菌 细胞,以及真核细胞例如酵母细胞,昆虫细胞,植物细胞和动物细胞(如哺乳动物细胞,例 如小鼠细胞、人细胞等)。本发明的宿主细胞还可以是细胞系。
[0037] 本发明还涉及到突变C0L4A4基因或C0L4A5基因编码的蛋白质,由于突变的 C0L4A4基因或C0L4A5基因发生了移码缺失突变,导致缺失位点后的编码的氨基酸序列完 全改变,且提前出现终止密码子,因此不具有野生型C0L4A4蛋白质或C0L4A5蛋白质正常的 结构和功能。本发明的突变型的C0L4A4或C0L4A5蛋白质可以是重组蛋白质、天然蛋白质、 合成蛋白质,优选重组蛋白质,即使用重组技术从原核或真核宿主(例如,细菌、酵母、高等 植物、昆虫和哺乳动物细胞)中产生。
[0038] 在本发明中,突变型C0L4A4或C0L4A5蛋白质还涉及具有与突变型C0L4A4或 C0L4A5蛋白质相同功能的的变异形式。变异形式包括:同源序列、保守性变异体、诱导突变 体等。发明还涉及突变型C0L4A4或⑶L4A5蛋白质类似物。这些类似物与突变型C0L4A4或 C0L4A5蛋白质的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差 异,或者兼而有之。
[0039] 本领域技术人员公知,致病基因具有多方面的用途。因此,本发明提供的突变 C0L4A4基因和/或C0L4A5基因的用途包括但不限于:用作治疗Alport综合征的药物靶点; 制备Alport综合征诊断试剂盒;用于产生疾病动物模型;为治疗Alport综合征提供新的 药物作用途径。
[0040] 本发明所述的"试剂盒"是指本领域技术人员以C0L4A4基因和/或C0L4A5野生 型或突变型核苷酸序列为基因探针,根据基因杂交的原理,可以检测生物样本中是否存在 与该探针序列互补的核苷酸序列,因此使用这种试剂盒可以检测出样本中是否存在着本发 明的基因突变位点。试剂盒一般包括:引物、探针、核酸芯片、说明书等,还可能包括与活性 成分相容的缓冲液、载体或媒介等。
[0041] 在本发明中,"引物"指用于在PCR反应中扩增靶标核酸的多核苷酸片段,其通常为 寡核苷酸,例如含有至少 5 个碱基,例如 5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、 21、22、23、24、25、30、35、40、45、50个或者更多个碱基的多核苷酸片段。引物不必与待扩增 的目的基因或其互补链完全互补,只要其能够特异性扩增目的基因。如本文中所使用的,术 语"特异性扩增"是指引物能够通过PCR反应扩增目的基因,而不扩增其他基因。例如,特 异性扩增C0L4A5基因是指,在PCR反应中引物只扩增C0L4A5基因,而不扩增其他基因,此 类引物的设计是本领域技术人员公知的。
[0042] 在本发明中,术语"特异性检测C0L4A4基因和/或C0L4A5突变的探针"是指探 针能够区分出含有突变的C0L4A4基因和/或C0L4A5与不含有突变的C0L4A4基因和/或 C0L4A5基因 。一般而言,可以通过控制杂交条件的严紧性,使得探针能够区分出含有突变 的基因与不含有突变的基因。例如,在高度严紧条件下,与C0L4A4基因精确互补的探针可 以与不含有突变的C0L4A4基因杂交,而不与甚至只包含一个点突变的突变的C0L4A4基因 杂交,从而将二者区分开。同样,还可以设计与突变的C0L4A4基因基因精确互补的探针,从 而其在高度严紧条件下与突变的C0L4A4基因杂交,而不与不含有突变的C0L4A4基因杂交。 在分子生物学领域中,探针的设计和杂交技术是熟知的。
[0043] 本发明涉及对突变的C0L4A4或C0L4A5蛋白质具有特异性的多克隆抗体和单克隆 抗体,尤其是单克隆抗体。这里,"特异性"是指抗体能结合于突变的C0L4A4或C0L4A5蛋 白质。较佳地,指那些能与突变的C0L4A4或C0L4A5蛋白质产物或片段结合但不识别和结 合于野生型的C0L4A4或C0L4A5蛋白质相关抗原分子的抗体。本发明不仅包括完整的单克 隆或多克隆抗体,而且还包括具有免疫活性的抗体片段,如Fab,或(Fab) 2片段;抗体重链; 抗体轻链;遗传工程改造的单链Fv分子或嵌合抗体。本发明的抗体可以通过本领域内技术 人员已知的各种技术进行制备。
[0044] 本发明的突变的C0L4A4或C0L4A5蛋白质抗体可以用来鉴定突变的C0L4A4或 C0L4A5蛋白质。例如,可以用一种可检测的分子例如荧光素异硫氰酸(FITC)来标记突变的 C0L4A4蛋白质特异抗体,然后让突变的C0L4A4蛋白质特异抗体与样品接触,再用荧光显微 镜或流式细胞仪检测出与突变的C0L4A4蛋白质特异抗体结合的样品,从而为预测或诊断 患者是否存在Alport综合症提供依据和指导。
[0045] 本发明的突变的C0L4A4或C0L4A5蛋白质抗体还可以用来中和突变的C0L4A4或 C0L4A5蛋白质。如果有足够的数据表明某个体的Alport综合征与本发明突变C0L4A4或 C0L4A5蛋白质的存在相关,可以考虑用突变的C0L4A4或C0L4A5蛋白质特异性抗体中和这 些致病突变C0L4A4或C0L4A5蛋白质分子,从而缓解患者的病症。
[0046] 实施例1 :样本获取
[0047] 发明人近几年在国内收集到两个ATS家系,家系1为4代30个汉族家系成员(图 1),呈常染色体显性遗传,家系2为4代10个汉族家系成员(图2),呈X染色体显性遗传,家 系1和家系2的所有家庭成员均进行了尿常规及肾功能的检查。家系1先证者(III: 12,病 例1)和家系2先证者(1111,病例2)均通过肾活检发现全部和节段性硬化及系膜扩张,电子 显微镜观察发现肾小球基底膜(GBMS)呈不规则增厚和分裂,依据临床和生化指标以及影 像学证据,结合我们所收集到的家族性病例,提示ATS的可能性较大。在家系1中选取10例 患者样本(11:1,11:3, 11:5, 11:7, 111:7, 111:9, 111:10, 111:12, III: 14,和 III: 15),9 例 正常家系样本共19例样本作为研究样本,在家系2中选取4例患者样本(II 1,III 1,III 3 和IV 1),2例正常家系样本共6例样本作为研究样本,每个样本采集外周血样品2ml,加入 EDTA抗凝,-80°C保存。
[0048] 随机收集100位与所述家系1和家系2无关的正常个体作为二次验证样本,每位 采集外周血样品2ml,加入EDTA抗凝,-80°C保存。
[0049] 实施例2 :样本DNA制备
[0050] 采用OMEGA Blood DNA Midi Kit全血DNA提取试剂盒从外周血样品中提取DNA, 提取步骤如下:
[0051] (1)取 2ml 全血样本,加入 150ul OB Protease,2. Iml Buffer BL 和 20ul RNase A,最大速度漩涡1分钟,彻底混匀。
[0052] (2) 65°C水浴15-20分钟,并在水浴过程中漩涡5次。
[0053] (3)加入2. 2ml无水乙醇,最大速度漩涡30秒,彻底混匀。
[0054] (4)将3. 5ml裂解液移入带过滤柱的15ml离心管,4000转离心5分钟,取出过滤 柱,倒掉过滤液体,放回过滤柱。
[0055] (5)将第3步剩余裂解液加入带过滤柱的15ml离心管,4000转离心5分钟,取出 过滤柱,倒掉过滤液体,放回过滤柱。
[0056] (6)加入3ml HB Buffer,洗涤过滤柱,4000转离心5分钟,取出过滤柱,倒掉过滤 液体,放回过滤柱。
[0057] (7)加入3ml DNA Wash Buffer, 4000转离心5分钟,取出过滤柱,倒掉过滤液体, 放回过滤柱。
[0058] (8)再次加入3ml DNA Wash Buffer, 4000转离心5分钟,取出过滤柱,倒掉过滤液 体,放回过滤柱。
[0059] (9) 4000转离心15分钟,甩干过滤柱。
[0060] (10)将过滤柱移至新的15ml离心管,加入500ul70摄氏度的Elution Buffer,室 温静置5分钟,4000转离心5分钟,收集含有DNA的过滤液。
[0061] (11)再次将过滤柱移至新的15ml离心管,加入500ul70摄氏度的Elution Buffer,室温静置5分钟,4000转离心5分钟,收集含有DNA的过滤液。
[0062] (12)利用分光光度计测量DNA的浓度及纯度,所得的每个标本基因组DNA的 0D260/0D280均位于1. 7?2. 0之间,浓度不少于200ng/ul,总量不少于30 μ g。
[0063] 实施例3 :外显子捕获与测序
[0064] 发明人用Agilent SureSelect人全外显子捕获试剂盒(Agilent SureSelect Human All Exon Kit)结合Solexa高通量测序技术对选取的实施例1的样本的外显子组 序列进行了测序,具体如下:
[0065] 1)将基因组DNA随机打断成150-200bp左右的片段,随后在片段两端分别连接上 接头制备杂交文库(参见http://www. illumina. com/提供的Illumina/Solexa标准建库 说明书)。
[0066] 2)文库经纯化后经过连接介导PCR(ligation-mediated PCR(LM-PCR))的线性扩 增与SeqCap EZ Oligo pool进行杂交富集,再经过LM-PCR的线性扩增后进行上机测序。测 序平台为Illumina Hiseq2000,读取长度为90bp,每个样本的平均测序深度最少为50X。
[0067] 3)测序后获得的原始数据由Illumina basecalling SoftwareL 7进行处 理,经过过滤去污染、使用S0APaligner2. 20#比对参考基因组Hgl9 (参考Li R,Li Y, KristiansenK, et al,SOAP:short oligonucleotide alignment program. Bioinforma tics2008, 24(5):713-714;Li R, Yu C, Li Y, et al,S0AP2:an improved ultrafast tool for short read alignment. Bioinformatics2009, 25 (15) :1966-1967,通过参考的方式 将其全文并入本文),以便获得比对到基因组上的唯一比对序列。然后利用SOAP snp(可 参见:Li R, Li Y, Fang X, Yang H, et al, SNP detection for massively parallel whole-genome resequencing.Genome Res2009, 19(6) :1124_1132,通过参考的方式将 其全文并入本文)确定祀区域的基因型。Indel (insertion-deletion,插入/缺失标 记)米用BWA(通过Burrows-Wheeler变换比对)(versionO. 5. 9_rl6)比对到参考基因 组 Hgl9(snpl32),然后利用 GATK(Genome Analysis Toolkit) (versionvl. 0.4705)确定 indel 的类型。(可参见 Li H, Durbin R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics2010 ;26(5):589-595 ;McKenna, A, Hanna M, Banks E, et al.The genome analysis toolkit:a MapReduce framework for analyzing next-generation DNA sequencing data. Genome Research2010 ;20 (9):1297-1303)〇
[0068] 结果显示,在病例I中发现有96772个单核苷酸多态性(SNP)和9712处的插 入 / 缺失(Indel)。随后通过 dbSNP 数据库(http://www.ncbi.nlm.nih.gov/projects/ SNP/snp_summary. cgi),千人基因组数据库(www. IOOOgenomes. org/)、HapMap 数据库 (http://hapmap. ncbi. nlm. nih. gov/)等公共数据库的过滤,去掉所有已知的且在数据库 中等位基因频率大于0. 005的变异。通过比对正常样本,去掉所有已知变异、同义突变以及 非编码区的变异,影响蛋白功能较小的位点,包括intron、intergenic、UTR、同义突变,并利 用SIFT软件进行SNP功能预测,最终得到72个杂合可能具有致病意义的SNP位点和14个 Indel。
[0069] 在病例2中发现有105963个SNPs和7335个Indel。随后通过dbSNP数据库、千人 基因组数据库、HapMap数据库等公共数据库的过滤,去掉所有已知的且在数据库中等位基 因频率大于0.005的变异。通过比对正常样本,去掉所有已知变异、同义突变以及非编码区 的变异,影响蛋白功能较小的位点,包括intron、intergenic、UTR、同义突变,并利用SIFT 软件进行SNP功能预测,最终得到70个杂合可能具有致病意义的SNP位点和13个Indel。
[0070] 实施例4 : Sanger法测序验证
[0071] 由于外显子组测序存在一定程度的假阳性,因此我们进一步利用Sanger测序法, 对上述对家系1的72个杂合可能具有致病意义的SNP位点以及14个Indel进行验证,以 及对家系2的70个杂合可能具有致病意义的SNP位点以及13个Indel进行验证,具体方 法步骤如下:
[0072] I. DNA 提取
[0073] 对实施例1的样本以及100例无血缘关系的正常对照的外周血按照实施例2的方 法提取基因组DNA。
[0074] 2.弓丨物设计及PCR反应
[0075] 引物设计参考人类基因组序列数据库hgl9/build37. 1,具体如下。
[0076] 检测移码缺失突变C0L4A4基因(c. 3213delA,P. Lysl071fs*5)的引物序列:
[0077] 上游引物:5'GGAITTCCAGGGACACCAG3'
[0078] 下游引物:5' TGTAATAGCCAAGACCTGAAGACA3'
[0079] 检测移码缺失突变C0L4A5基因上(c. 499delC,p. Prol67Gln fs*36)的引物序列:
[0080] 上游引物:5'TGAATCTTCAGATCATTTTTCTGG3'
[0081] 下游引物:5,GAGGGATTGTTGTAATCTTCTGG3,
[0082] 反应体系:
【权利要求】
1. 一种突变的C0L4A4基因,其特征在于:所述突变的C0L4A4基因序列导致Alport综 合征的发生,其基因序列如SEQ ID N0:2所示。
2. -种如权利要求1所述的突变的C0L4A4基因编码的蛋白质,其特征在于:所述蛋白 质的氨基酸序列如SEQ ID N0:4所示。
3. -种突变的C0L4A5基因,其特征在于:所述突变的C0L4A5基因序列导致Alport综 合征的发生,其基因序列如SEQ ID N0:6所示。
4. 一种如权利要求3所述的突变的C0L4A5基因编码的蛋白质,其特征在于:所述蛋白 质的氨基酸序列如SEQ ID N0:8所示。
5. -种载体,其特征在于:所述载体含有如权利要求1所述的突变的C0L4A4基因和/ 或如权利要求3所述的突变的C0L4A5基因。
6. -种遗传工程化的宿主细胞,其特征在于:所述宿主细胞为权利要求5所述的载体 转化或转导的宿主细胞。
7. 如权利要求1所述的突变的C0L4A4基因在作为治疗Alport综合征的药物靶点或制 备Alport综合征诊断试剂盒中的应用。
8. 如权利要求3所述的突变的C0L4A5基因在作为治疗Alport综合征的药物靶点或制 备Alport综合征诊断试剂盒中的应用。
9. 一种用于诊断Alport综合征的试剂盒,其特征在于:所述试剂盒包含能够特异性扩 增如权利要求1所述的突变的C0L4A4基因和/或如权利要求3所述的突变的C0L4A5基因 的引物,或能够特异性检测如权利要求1所述的突变的C0L4A4基因和/或如权利要求3所 述的突变的C0L4A5基因的探针。
10. 如权利要求9所述的试剂盒,其特征在于:所述引物包括上游引物 5' -GGAITTCCAGGGACACCAG-3',下游引物 5' -TGTAATAGCCAAGACCTGAAGACA-3' ;和 / 或上游 引物 5' -TGAATCTTCAGATCATTTTTCTGG-3',下游引 5' -GAGGGATTGTTGTAATCTTCTGG-3'。
11. 一种抗体,其特征在于:所述抗体与权利要求2所述的蛋白质特异性结合,且不作 用于野生型C0L4A4基因所编码的蛋白质。
12. -种抗体,其特征在于:所述抗体与权利要求4所述的蛋白质特异性结合,且不作 用于野生型C0L4A5基因所编码的蛋白质。
13. -种Alport综合征治疗剂,所述治疗剂包含权利要求11和/或权利要求12所述 的抗体。
【文档编号】A61P27/02GK104212806SQ201410352908
【公开日】2014年12月17日 申请日期:2014年7月21日 优先权日:2014年7月21日
【发明者】肖晶晶, 管李萍, 张建国, 邓昊, 徐洪波, 宋治, 郑文 申请人:深圳华大基因科技有限公司