神经系统遗传性疾病基因联合筛查方法、试剂盒及其制备方法
【专利摘要】本发明提供了一种神经系统遗传性疾病基因联合筛查方法、试剂盒及其制备方法。本发明的基因筛查方法首先是构建受检者的全基因组DNA文库,然后利用制备的神经系统遗传疾病基因筛查试剂盒捕获靶基因序列,再通过高通量测序平台(Illumina HiSeq 3000)的双端150bp测序模式对样本进行检测,生物信息学分析数据结果,找出与神经系统遗传疾病相关基因的突变信息位点,以达到基因诊断的目的。本发明提供的方法能快速、准确且能够覆盖目前已知的所有神经系统遗传疾病基因的外显子区域。
【专利说明】
神经系统遗传性疾病基因联合筛查方法、试剂盒及其制备 方法
技术领域
[0001 ]本发明设及基因筛查技术领域,更具体地,设及一种筛查各类神经系统遗传性疾 病的试剂盒及其制备和使用方法。
【背景技术】
[0002] 神经系统遗传疾病是由于生殖细胞或受精卵遗传物质的异常,使发育的个体出现 W神经系统功能缺损为主要临床表现的疾病。神经系统遗传性疾病的病种最多,在人类 5000余种单基因病中,累及神经系统的约占60%。遗传方式包含单基因遗传、多基因遗传、 线粒体病W及染色体病,中国的神经系统单基因遗传病患病率约为109.3/100,000。神经系 统遗传病可在任何年龄发病,但绝大多数在小儿或青少年期出现临床症状与体征,具有家 族性和终生性特点,不少疾病的病因和发病机制尚未阐明,致残、致崎及致愚率很高,治疗 困难,危害极大。很多神经系统遗传病具有显著的临床和遗传异质性,一种疾病可W由不同 的致病基因引起,而一个基因的突变又可累及不同的系统。因此,常有不能判断引起疾病的 具体的基因突变,或疾病本身症状不典型,导致鉴别诊断的困难。W往对神经系统遗传疾病 的诊断主要依靠病史、症状体征、家系调查或常规辅助检查等方法,但运些常规诊断方法难 W对遗传疾病做出早诊断或症状前诊断,从而导致错过预防或早期治疗的最佳时期,对身 体造成不可逆的损伤。
[0003] 基因检测是神经系统遗传病早期诊断的有效手段。然而,目前仍然没有一种能同 时筛查多种神经系统遗传性疾病的试剂盒。归结原因有二:其一,致病基因多,序列长,目前 被定位或克隆的神经遗传性疾病相关致病基因约235个;其二,传统测序方法效率低,成本 高。传统的Sanger测序每小时只能检测6千个碱基序列,对于很多具有遗传和临床异质性的 疾病,该方法无法高效富集基因组片段进行大规模测序。理论上一次性筛查多种疾病可能 需要数月之久,且耗费极高,不适合于临床推广。
[0004] 近几年,随着第二代测序平台(Next-Generation Sequencing,NGS)的诞生和发 展,可在10个小时内检测4-6亿个碱基序列。不仅极大地减少了测序时间,同时也极大地降 低了成本。克服了 Sanger测序在应用范围和应用成本上的不足,基于NGS的祀向基因测序 (target gene sequencing,TGS)、全基因外显子组测序(whole exome sequencing,肥S)和 全基因组测序(whole genome sequencing,WGS),在神经系统单基因遗传病的基因诊断中 已有应用。
[0005] 因此,设计一种设及最多种类神经系统遗传性疾病、包含最全面的致病基因的检 测试剂盒,并且能结合第二代测序技术,高效低成本地筛查遗传性神经系统疾病,实现对患 者、致病基因携带者及高危产儿等对象的早期筛查,可在基因表达水平上确诊和预测疾病, 对早期治疗、干预措施提供指导意见。
【发明内容】
[0006] 本发明的目的在于提供一种能高效、准确地联合筛查多种神经系统遗传性疾病的 试剂盒及其制备方法。另一方面还提供一种广谱的神经系统遗传性疾病的基因联合筛查方 法。
[0007] 本发明一方面,提供一种神经系统遗传性疾病基因联合筛查试剂盒,所述试剂盒 包含与929种各类神经系统遗传性疾病相关的854个致病基因或疾病易感基因中全部外显 子序列的特异性寡核巧酸捕获探针。
[000引进一步地,所述探针长度为50~10化P。
[0009] 进一步地,所述探针W生物素标记。
[0010] 具体地,所述与神经系统遗传性疾病相关的致病基因或疾病易感基因如表1所示:
[0011] 表1:神经系统遗传性疾病基因筛查列表
[0012]
[0019] 本发明另一方面,提供一种制备上述神经系统遗传性疾病基因联合筛查试剂盒的 方法,包含如下步骤:
[0020] (1)根据人类基因组HG19序列,调取表1中全部与神经系统遗传性疾病发生相关基 因的外显子序列;
[0021] (2)针对全部外显子序列非重复区域设计50~10化P长度的捕获探针,每个探针沿 着基因位置挪动3~lObp,目标区域每个碱基被探针覆盖3~20次。
[0022] (3)合成步骤(2)所设计的捕获探针,并W生物素标记。
[0023] 本发明的再一方面,提供一种神经系统遗传性疾病基因联合筛查方法,包括W下 步骤:
[0024] (1)获取、检测受检者的全基因组DNA(曲NA)样本;
[00巧](2)构建受检者全基因组文库;
[0026] (3)采用上述试剂盒中的捕获探针与受检者DNA文库混合,目标区域基因片段与探 针杂交,探针通过标记的生物素与带有亲和素的磁珠结合;
[0027] (4)将未结合的非目标区域的DNA片段洗脱;
[0028] (5)利用新一代高通量测序仪对目标区域基因组进行测序、分析,获取疾病相关基 因的所有突变信息。
[00巧]进一步地,所述高通量测序仪为111皿ina化Seq 3000型。
[0030] 进一步地,步骤(5)中所述分析过程包括W下步骤:
[0031] (1)从高通量测序仪(111皿ina化Seq 3000)获取原始数据;
[0032] (2)利用化im Galore软件对测序数据从3'端动态去除接头序列片段和低质量片 段;
[0033] (3)用化stQC软件对预处理数据进行质量控制分析;
[0034] (4)通过BWA软件把有效测序数据比对到人类参考基因组中;
[0035] (5)统计祀标区域信息,包括祀标区域平均覆盖度、插入片段平均分布图、目标区 域测序深度等;
[0036] (6)采用GATK3.1.1进行变异检测,SNP和Indel变异识别、校正、过滤;
[0037] (7)用ANN0VAR对变异位点进行注释,最后筛选出疾病相关的SNP或Indel变异。
[0038] 缩写与定义:
[0039] SNP 单核巧酸多态性
[0040] Indel插入缺失标记 [0041 ] 曲NA全基因组DNA
[0042] 神经系统遗传性疾病
[0043] 神经系统遗传疾病是由于生殖细胞或受精卵遗传物质的异常,使发育的个体出现 W神经系统功能缺损为主要临床表现的疾病。神经系统遗传性疾病的病种最多,在人类 5000余种单基因病中,累及神经系统的约占60%。表1I中为常见神经系统疾病的名称及分 类情况:
[0044] 表1I.常见神经系统疾病的名称及分类
[0045]
[0051] 目标序列捕获探针
[0052] 目标序列捕获是指通过某种方法有选择性的分离或者富集基因组的特定片段。目 标序列捕获的一种重要的方法是根据核酸分子碱基互补杂交原理发展的。即根据目标基因 组序列,设计与之完全互补的探针,将运些探针固定在某些支持物上(用于分离),然后打断 基因组DM,加上接头(用于测序)后与探针杂交,洗脱未杂交上的DNA,回收目标DM片段,可 W直接建库进行DNA测序。
[0053] 根据杂交时状态不同,目标序列捕获可W分为固相杂交法和液相杂交法。固相杂 交法所用的探针通常都是固定在固体支持物上,如玻璃片2,3、塑料球等,其中最典型的是 基因忍片。固相捕获系统构建如下,首先选定目标DNA区域,在修饰了的玻璃片基上原位合 成一系列与目标区域互补的探针。通常,基因忍片是杂交后,洗脱未杂交上的DNA片段,然后 扫描成像获取每个探针的杂交信号,而固相杂交捕获则只有最后一步不同,即与探针杂交 的DNA被洗脱下来,用于后序的测序工作。
[0054] 液相杂交与固相杂交最大的差异在于杂交反应的环境不同。液相杂交是通过在溶 液中,目标DNA片段和已带有生物素标记探针直接杂交,然后通过生物素-亲和素的反应使 目标DNA片段错定在带有亲和素的微珠上。洗去非目标DNA,洗脱后,富集的DNA用于测序。液 相杂交与固相杂交相比有两大优势:第一、杂交效率更高;第二、易于操作,时间短,便于自 动化操作。
[0055] -般来说一个8碱基的探针就有了足够的杂交特异性,而探针越长,杂交的特异性 就越差。目前商业试剂盒的探针长度都在60nt到200nt之间,运其中的一个重要考虑是,杂 交的特异性限定(或杂交的错配容忍度)。我们需要研究的是目标DNA片段中发生的突变、插 入/缺失等,如果探针特异性太高,在DNA捕获时就会产生有利于参考序列(与探针完全互补 的序列)的选择,运在后期数据统计上就会产生明显的偏差,而探针太长又会有太多的非特 异杂交,非目标序列会急剧增加。
【附图说明】
[0056] 图1、神经系统遗传性疾病基因筛查方法示意图。
[0057] 图2、高通量测序示意图。
[005引图3、1例脾骨肌萎缩症患者家系图谱和Sanger测序结果。
【具体实施方式】
[0059] -、使用试剂盒筛查216例神经遗传性疾病患者的致病基因
[0060] 患者病征:女,17岁,自六岁开始出现行走不稳,十五岁因左侧足内翻行手术矫正。
[0061] 临床表现:四肢远端肌力减弱,双手肌肉萎缩,四肢腫反射减弱。肌电图检查提示 多发性周围神经损害,运动感觉神经轴索损害为主。
[0062] 诊断:脾骨肌萎缩症(化arcot-Marie-ToothiCMT)亦称为遗传性运动感觉神经病 (HMSN)。
[0063] 发病率:1/2500。
[0064] 疾病特点:具有明显的遗传异质性,临床主要特征是四肢远端进行性的肌无力和 萎缩伴感觉障碍。多数呈常染色体显性遗传,也可呈常染色体隐性或X-连锁遗传。
[0065] 检测病种:运动神经元病、遗传性共济失调、肌肉疾病、遗传代谢病等。
[0066] 致病基因:PMP22、MPZ、LITAF、EGR2、W^、KIF1B、MFN2、RAB7A、LMNA、MED25、TRPV4、 GARS、肥化、HSPB1、GDAP1、MPZ、HSPB8、面M2、AARS、DYNC1Η1、LRSAM1、畑TKD1、EGR2、PMP2 2、 PRX、MTMR2、S邸2、SBF1、S册 TC2、NDRG1、EGR2、PRX、服1、FGD4、FIG4、SURF1、DNM2、YARS、INF2、 GNB4、GDAP1、KARS、PLEK服5、GJB1、BSCL2、PRPS1、PDK3、HOXD1ο、CTDP1、SEPT9、SOXlο、CCT5 等。
[0067] 检测手段:用制备的神经系统遗传疾病基因筛查试剂盒捕获目的基因序列,再利 用高通量测序平台(Illumina HiSeq 3000)的双端15化Ρ测序模式对样本进行检测,通过生 物信息学分析数据结果,找出与神经系统遗传疾病相关基因的突变信息位点,W达到基因 诊断的目的。
[0068] 检测过程如图1所示。具体包括W下几个环节:
[0069] ( - )神经系统遗传性疾病外显子区域捕获探针试剂盒制备
[0070] 根据人类基因组HG19序列,调取表1中全部与神经系统遗传性疾病发生相关基因 的外显子序列,基于罗氏液相杂交技术(SeqCap EZ),采用Roche NimbleGen优化的迭代 (Repeat mask)算法,对每个外显子区域中非重复区域设计50-105bp的探针序列,每个探针 沿着基因位置挪动设计,探针之间的挪动大小3-lObp,且目标区域每个碱基被探针至少覆 盖3次,最多不超过20次。采用常规技术将探针W生物素标记。
[0071] (二)患者全基因组文库构建
[0072] 从患者体内抽取3~5血血液,从中抽提3-扣g基因组DNA(曲NA),片段化处理曲NA, 加接头、纯化、扩增W构建全基因组DNA文库。具体过程如下:
[0073] 1、DNA样本制备(使用QIGEN公司QIAamp DNA Blood Maxi Kit提取):
[0074] (1)取20化1 QIGEN蛋白酶加入到2mL全血中,混匀。
[00巧](2)加2.4mL AL溶液,充分混匀,振荡lmin,7(TC解育lOmin。
[0076] (3)加入2mL无水乙醇,充分振荡混匀后,转移至装在新离屯、管上的QIAampMidi column 中,3000巧m 离屯、3min。
[0077] (4)去离屯、后的废液,重复离屯、一次。
[007引(5)在QIAampMidi column中加2mL AW1 溶液,5000巧m离屯、15min。
[0079] (6)弃废液,向QIAampMidi column中加2mL AW2溶液,5000巧m离屯、15min。
[0080] (7)将QIAampMidi column转移至新的离屯、管上,在QIAampMidi column上加入300 μL AE,室溫放15min,而后5000巧m离屯、2min。
[0081 ] (8)重复步骤7,最后得到60化1曲ΝΑ溶液。
[0082] 2、曲ΝΑ质检:
[0083] 取化L曲ΝΑ加入到化no化op仪器(美国Thermo公司)中检测DNA溶液浓度,根据浓 度取50ng用1%琼脂糖电泳检测。
[0084] 3、DNA文库构建
[00化](l)DNA片段化:取化g DNA,用RB溶液稀释至120yL,用超声破碎仪(Bior叫ter公 司)打断,7.5min/次,超声8次。
[0086] (2)DNA末端补平:取60化片段化的DNA,加40化末端补平缓冲液(illumina En化邱air buffer),混匀,离屯、;PCR仪中30°C反应30min,再加入 160μΙ AmpureBeads(美国 Beckman公司),充分混匀,室溫放置15min;放磁力架,室溫放置5min,去上清;加200化80% 乙醇,室溫30s,去上清,重复1次;室溫干燥15min;加20化RB溶液,从磁力架上取下,充分混 匀,室溫放置5min,取上清17.5化到一个新管中。
[0087] (3)加 A:加 12.5化 A-tailing buffer(瑞±Roche公司巧Ijl7.扣L DNA中,充分混 匀,PCR仪中37°C反应30min。
[008引 (4)加接头:依次加2.扣L RB,2.化L ligation Mix 2.5化接头,混匀30°(:反应 lOmin;方口5μΙ Stop ligation buffer,混匀;再方口42.5μΙ AmpureBeads(美国Beckman公 司),充分混匀,室溫放置15min;放磁力架上,室溫反应5min,去上清,勿动beads;加入20化L 80%乙醇,室溫30s,去上清,重复1次;室溫干燥15min;加22化RB,从磁力架上取下,充分混 匀,室溫放置5min;放置磁力架上,取上清20化到一个新管中。
[0089] (5化〔3富集:取20化0魁,5化??(:,2化1?0?1111义;98°(:反应3〇3,10个循环(981: 10s,6(TC30s,72°C30s),72°C5min,1(TC保存;再加入50化 AmpureBeads(美国Beckman公 司),充分混匀,室溫放置15min ;放磁力架,室溫放置5min,去上清,勿动beads ;加200μΙ 80%乙醇,室溫30s,去上清,重复1次,室溫干燥15min;加32化RB,从磁力架上取下,充分混 匀,室溫放置5min;放置磁力架上,取上清30化到一个新管中。
[0090] (6)定量:如bit(美国invitrogen公司)定量DNA文库。
[0091] (Ξ)采用试剂盒捕获目的基因序列并进行高通量测序、分析
[0092] 用步骤(一)制备的神经系统遗传性疾病基因筛查试剂盒捕获祀基因序列并进行 高通量测序、分析过程如图2所示,具体步骤如下:
[OOW] 1、祀序列捕获
[0094] (1)第一次杂交:每个文库取50化g,6个不同接头的文库等量混合,真空浓缩至40μ L;方口50μΙ Capture Target buffer 1;方口ΙΟμΙ Exome Enrichment Use Capture Target 011旨〇3(瑞壬1?〇证日公司),充分混匀,离屯、;?〔1?,95"€1〇111;[]1,18个循环(93"€1111;[]1,每个循环 降低 2°C),58°C18h。
[00巧](2)第一次wash:加250化充分混匀的链霉亲和素磁珠 (streptavidin Ma即etic Beads),充分混匀,室溫静置30min;磁力架放置2min,去上清;加200化Wash solution 1 (瑞:tRoche公司),充分混匀;磁力架放置2min,去上清;加200化Wash solution 2(瑞:t Roche公司),充分混匀;磁力架放置2min,去上清。
[0096] (3 )DNA洗脱:加混合好的化0H,30化到管中,混匀,室溫放置5min;磁力架放置 2111;[]1,取上清28.5化至一新离屯、管中;加扣L Elute 1:a;rget buffer 2(瑞:tRoche公司),混 匀。
[0097] (4)第二次杂交:取30化 DNA,加 ΙΟμΙ d地2〇,至40化;加50μΙ Capture Target bufferl(瑞±Roche公司);方口ΙΟμΙ Exome Enrichment Use Capture Target Oli邑os(瑞± 1?〇^16公司);充分混匀,离屯、;?〇?,95°(:10111111,18个循环(93°(:1111111,每个循环降低2°(:),58 °C18h〇
[0098] (5)第二次wash:加250化充分混匀的链霉亲和素磁珠 (streptavidin Ma即etic Beads),充分混匀,室溫静置30min;磁力架放置2min,去上清;加200化Wash solution 1 (瑞:tRoche公司),充分混匀;磁力架放置2min,去上清;加200化Wash solution 2(瑞:t Roche公司),充分混匀;磁力架放置2min,去上清。
[0099] (6 )DNA洗脱:加混合好的化0H,30化到管中,混匀,室溫放置5min;磁力架放置 2min,取上清28.5化至一新离屯、管中;加扣L Elute 1:arget buffer2(瑞:tRoche公司),混 匀。
[0100] (7)PCR:20yL 0臟,5化 PPC,2扣L PCRmix;98°C30s,10个循环(98°C10s,6(TC30s, 72°C30s),72°C5min,10°C保存;加50μΙ AmpureBeads(美国Beckman公司),充分混匀,室溫 放置15min;放磁力架,室溫放置5min,去上清,勿动beads;加20化L80 %乙醇,室溫30s,去上 清,重复1次;室溫干燥15min;加32化RB,从磁力架上取下,充分混匀,室溫放置5min;放置 磁力架上,取上清SOiiL到一个新管中,得到祀序列文库。
[0101] 2、簇生成
[0102] (1)用如bit仪器(美国invitrogen公司)定量文库;
[0103] (2)将文库稀释至lOnM;
[0104] (3)取化L lOnM文库,加 ΙμΙ 2N NaOH,加 1 如L TrisCl,混匀,室溫放置5min;
[0105] (4)取化L步骤3溶液,力的9化L冷的杂交buffer;
[0106] (5)取14化L步骤4溶液,放在8连管中,置于cBot的template栏中;
[0107] 3、通过111皿ina Hiseq3000测序,得到测序数据。测序参数如下: 目标基因数目 854个 目标区域长度(bp) 4.8 Mb
[010引 目标区域覆盖率 98.6% 目标区域测序平均深度(X ) 100X 目标区域平均深度>20X位点所占比例 95.9%
[0109] 4、生物信息分析流程:
[0110] (1)利用化im Galore软件对测序数据从3'端动态去除接头序列片段和低质量片 段。
[0111] (2)用化stQC软件对预处理数据进行质量控制分析。
[0112] (3)通过BWA软件把有效测序数据比对到人类参考基因组中(最多的错误匹配数目 为3个,seed长度为32,seed中错误匹配的个数不得超过2个)。
[0113] (4)统计祀标区域信息:祀标区域平均覆盖度、插入片段的大小、Reads落于目的区 域、目的区域附近、非目的区域的分布比例、目的区域内不同覆盖深度的碱基分布比例等。
[0114] (5)采用GATK3.1.1进行变异检测,SNP和Indel变异识别、校正、过滤。采用picard- tools软件去除由于在建库过程中PCR产生的重复序列;采用Smith-Waterman序列比对算法 (Smith-Waterman alignment algorithm)针对已知indels(来自化SNP138数据库,化G indels)附近区域进行局部重新比对,去除在比对中的错误;针对来自测序仪产生的碱基质 量分数Quality Score进行校正;通过GATK的UnifiedGenotyper程序对W上一系列操作后 的比对BAM文件进行SNP和Indel的变异检测;针对上一步call出来的变异位点进行过滤,去 掉不可信的位点。
[011引(6)用ANN0VAR对变异位点进行注释,利用千人基因组、化SNP信息、ESPXLINVAR、 CADD、C0SMIC、NCI60等数据库对变异注释。确定变异发生的基因、位置、碱基改变、杂合或纯 合变异、变异发生的频率等信息。判别SNP变异为同义或非同义变异、预测氨基酸的改变对 蛋白质功能的影响,注释Indel变异为译码框缺失或是插入突变等信息。
[0116] (7)对候选SNP和Indel位点筛选,对变异质量分数、基因组区域特征等信息过滤变 异位点,SNP变异位于编码区且影响氨基酸变化的错义突变或终止子突变为筛选条件, Indel变异是否为译码框突变为筛选条件。其他辅助筛选条件包括测序深度、千人基因组中 突变频率、物种间的保守性、是否为有害突变(SIFT Score)等,最后筛选出疾病相关的SNP 或Indel变异。
[0117] (8)检测结果及分析
[0118] 本次基因测序检测发现受检者携带MFN2基因的一个杂合新的变异位点c.379G〉A。 MFN2基因中的多个位点突变是脾骨肌萎缩症常见的致病原因,并多为显性遗传。c.379G〉A 突变导致MFN2基因编码氨基酸序列上第127位甘氨酸突变为丝氨酸。Engelfried (Engelfried Κ et al.,Charcot-Marie-Tooth neuropathy type 2A:novel mutations in the mitofusin 2gene(MFN2).BMC medical genetics.,2006;7:53)和Qumg(Qumg KW et al.,Early onset severe and late-onset mild Charcot-Marie-Tooth disease with mitofusin 2(MFN2)mutations.Brain:a journal of neurology.2006Aug;129(Pt 8): 2103-18)等研究发现脾骨肌萎缩症患者携带杂合型c. 379G〉A变异位点。此外,该位点经 Polyphen2软件预测可能会产生蛋白毒性,并且在千人数据库中检出频率极低。因此, c.379G〉A杂合型变异可能导致受检者患病。
[0119] 表1II.1例脾骨肌萎缩症患者发生MFN2基因 c.379G〉A突变位点信息
[0120]
[0121] 为了进一步验证基因筛查结果,对患者遗传病家系进行连锁分析。对患者及其父 母和兄弟的C. 3 79G〉A位点进行Sanger测序验证实验,发现患者C. 379G〉A位点的基因型与其 母亲和兄弟的基因型相同,均为杂合型变异,患者父亲该位点为正常型,而患者和其母亲及 兄弟Ξ者均有脾骨肌萎缩症相关临床症状,其父亲无相关临床症状,表明c.379G〉A位点极 可能为患者疾病的致病原因,并为显性遗传。家系图谱和Sanger测序结果如图3所示。
[0122] 上述具体实施方法,仅是对本发明的最优实施方式进行描述,而非对本发明的范 围进行限定,在不超出本发明基本设计思路的前提下,一切对本发明技术方案做出的调整、 变形及改变,均应归入本发明权利要求书确定的保护范围。
【主权项】
1. 一种神经系统遗传性疾病基因筛查试剂盒,其特征在于,所述试剂盒包含与表1中所 示神经系统遗传性疾病相关的854个致病基因或疾病易感基因中全部外显子序列的特异性 寡核苷酸捕获探针。2. 如权利要求1所述试剂盒,其特征在于,所述探针长度为50~105bp。3. 如权利要求1所述试剂盒,其特征在于,所述探针以生物素标记。4. 制备如权利要求1所述试剂盒的方法,其特征在于,包含如下步骤: (1) 根据人类基因组HG19序列,调取表1中全部与神经系统遗传性疾病发生相关基因的 外显子序列; (2) 针对全部外显子序列非重复区域设计50~105bp长度的捕获探针,每个探针沿着基 因位置挪动3~10bp,目标区域每个碱基被探针覆盖3~20次。 (3) 合成步骤(2)所设计的捕获探针,并以生物素标记。5. -种神经系统遗传性疾病基因联合筛查方法,包括以下步骤: (1) 获取、检测受检者的全基因组DNA样本; (2) 构建受检者全基因组文库; (3) 采用如权利要求1-3任一项所述试剂盒中的捕获探针与受检者DNA文库混合,目标 区域基因片段与探针杂交,探针通过标记的生物素与带有亲和素的磁珠结合; (4) 将未结合的非目标区域的DNA片段洗脱; (5) 利用新一代高通量测序仪对目标区域基因组进行测序、分析,获取疾病相关基因的 所有突变信息。6. 如权利要求5所述筛查方法,其特征在于,所述高通量测序仪为11 lumina HiSeq 3000 型。7. 如权利要求5所述筛查方法,其特征在于,步骤(5)中所述分析过程包含以下步骤: (1) 从高通量测序仪(IIlumina HiSeq 3000)获取原始数据; (2) 利用Trim Galore软件对测序数据从3'端动态去除接头序列片段和低质量片段; (3) 用FastQC软件对预处理数据进行质量控制分析; (4) 通过BWA软件把有效测序数据比对到人类参考基因组中; (5) 统计靶标区域信息,包括靶标区域平均覆盖度、插入片段平均分布图、目标区域测 序深度等; (6) 采用GATK3.1.1进行变异检测,SNP和Indel变异识别、校正、过滤; (7) 用ANN0VAR对变异位点进行注释,最后筛选出疾病相关的SNP或Indel变异。
【文档编号】C12Q1/68GK106011224SQ201510982601
【公开日】2016年10月12日
【申请日】2015年12月24日
【发明人】熊玉宇, 邹晓文, 杨福兰, 叶思彬
【申请人】晶能生物技术(上海)有限公司