一种高胆固醇血症致病基因筛查探针设计方法及其基因芯片与流程

文档序号:19472164发布日期:2019-12-21 02:25阅读:来源:国知局

技术特征:

1.一种高胆固醇血症致病基因筛查探针设计方法,包括:

步骤1探针设计,探针组的数量为7,其中探针组1为jl3_1、探针组2为jl_1、探针组3为jl4_1、探针组5为jl1_1、探针组6为jl2_1、探针组7为jl-utr_1,探针总数量为12944,探针包大小为1.012mbp,每个样品的推荐最小排序为202.577mbp;

步骤2捕获建库和测序,首先对dna进行高效富集,然后在illumina平台上进行高通量、高深度测序,所述建库实验采用agilentsureselectxtcustom试剂盒;

步骤3生物信息分析,首先对测序得到的原始测序序列进行原始数据质控,然后进行序列比对,在进行完变异检测与注释后展开共有突变分析、基于位点显著性分析以及基于基因显著性分析。

2.根据权利要求1所述的一种高胆固醇血症致病基因筛查探针设计方法,其特征在于,所述步骤2捕获建库和测序进一步包括:

步骤201,dna样品检测。对dna样品的检测主要包括2种方法:1)琼脂糖凝胶电泳分析dna降解程度以及是否有rna、蛋白质污染;2)qubit对dna浓度进行精确定量,其中含量在0.5μg以上的dna样品被用来建库;

步骤202,捕获建库。将基因组dna经covaris破碎仪随机打断成长度为180-280bp的片段,经末端修复和加a尾后在片段两端分别连接上接头制备dna文库,将带有特异index的文库pooling后与生物素标记的探针进行液相杂交,再使用带链霉素的磁珠将基因组上的特定目标区域捕获下来,经pcr线性扩增后进行文库质检,待质检合格后即可进行测序;

步骤203,库检。文库构建完成后,先使用qubit2.0进行初步定量,随后使用agilent2100对文库的insertsize进行检测,insertsize符合预期后,使用qpcr方法对文库的有效浓度(3nm)进行准确定量,以保证文库质量;

步骤204,上机测序。依据合格文库的有效浓度及数据产出需求,进行illuminahiseq4000pe150测序。

3.根据权利要求1所述的一种高胆固醇血症致病基因筛查探针设计方法,其特征在于,所述步骤3中的原始数据质控进一步包括:

测序得到的原始测序序列,里面含有带接头的、低质量的reads。为了保证信息分析质量,需要对rawreads进行精细过滤,得到cleanreads,后续分析都基于cleanreads进行,具体包括如下步骤:

1)去除带接头(adapter)的reads对;

2)当单端测序read中n(n表示无法确定碱基信息)的比例大于10%时,需要去除此对reads;

3)当单端测序read中含有的低质量(低于5)碱基数超过该条read长度比例的50%时,需要去除此对reads。

4.根据权利要求1所述的一种高胆固醇血症致病基因筛查探针设计方法,其特征在于,所述步骤3中的序列比对进一步包括:有效测序数据通过bwa比对到参考基因组,得到bam格式的最初的比对结果,然后,用samtools对比对结果进行排序;再用picard标记重复reads(markduplicatereads),再利用重复标记后的比对结果进行覆盖度、深度的统计。

5.根据权利要求1所述的一种高胆固醇血症致病基因筛查探针设计方法,其特征在于,所述步骤3中的变异检测与注释进一步包括:

在比对结果的基础上,利用samtools识别snp位点和indel,并采用预设的过滤标准对snp位点和indel进行过滤,所述过滤标准如下:

a)过滤千人基因组数据库变异位点,去除个体间多样性位点,得到真正可能致病的罕见突变(rare):保留1000g中频率低于0.01的变异位点;

b)保留外显子区(exonic)或剪接位点区(splicing,上下10bp)的变异;

c)去除同义突变,得到对基因表达产物有影响的突变;

d)依据sift、polyphen、mutationtaster,cadd这4个软件,要求这4个软件中,至少有一半支持该位点可能有害,该位点才被保留,变异筛选和统计之后,对筛选出的snv、indel两种类型变异分别进行变异信息的注释,其中snv和indel的注释包括千人基因组计划、exac、novo-zhonghua和其他已有的数据库的注释信息,注释内容包含6个部分,分别为优先级信息、基因及区域注释、数据库频率注释、保守有害性预测、变异位点信息、基因功能及通路注释。

6.根据权利要求1所述的一种高胆固醇血症致病基因筛查探针设计方法,其特征在于,所述步骤3中的共有突变分析进一步包括:在位点过滤的基础上,筛选样本间共有的突变基因,筛选的比例为10%的患者中共有,如果计算患者中10%的比例所包括的共有样本数时,得到的结果中带有小数,则需要向上取整,比如,经计算得到10%的样本数是19.2,则需要筛选至少20个样本共有的突变基因,根据实际情况可调参。

7.根据权利要求1所述的一种高胆固醇血症致病基因筛查探针设计方法,其特征在于,所述步骤3中的基于位点显著性分析进一步包括:利用plink对变异位点进行关联分析,利用fisher检验计算患者与正常人之间具有显著性差异的位点:计算每个snp位点的p值和or值,通过关联的显著度p-value,筛选显著性关联的变异位点,这部分变异位点即为与家族性高胆固醇血症相关的变异位点。

8.根据权利要求1所述的一种高胆固醇血症致病基因筛查探针设计方法,其特征在于,所述步骤3中的基于基因显著性分析进一步包括:在位点过滤的基础上,利用skat算法在基因层面对突变进行burdenanalysis,从基因层面挖掘与疾病相关的变异,有利于发现与疾病相关的罕见变异。

9.一种高胆固醇血症致病基因筛查的基因芯片,其特征在于,所述基因芯片包括固相载体和固定于所述固相载体上的探针,所述探针序列如序列表1-158所示。

10.根据权利要求9所述的基因芯片,其特征在于,所述固相载体选自载玻片、硅片、膜或高分子材料中的任意一种,所述膜选自硝酸纤维素膜、尼龙膜、聚苯乙烯膜中的任意一种。


技术总结
本发明公开了一种高胆固醇血症致病基因筛查探针设计方法及其基因芯片,该方法分为3个步骤,分别是步骤1探针设计,步骤2捕获建库和测序以及步骤3生物信息分析,其中探针组的数量为7,其中探针组1为JL3_1、探针组2为JL_1、探针组3为JL4_1、探针组5为JL1_1、探针组6为JL2_1、探针组7为JL‑UTR_1,探针总数量为12944,探针包大小为1.012Mbp,每个样品的推荐最小排序为202.577Mbp。所述基因芯片包括固相载体和固定于所述固相载体上的探针。本发明对所有的致病基因和SNPs进行系统性归纳和汇总,最终绘制一幅完整的筛选目标区域,能够显著提高我国家族性高胆固醇血症患者的检出率。

技术研发人员:王绿娅;江龙;张峰
受保护的技术使用者:首都医科大学附属北京安贞医院
技术研发日:2018.12.25
技术公布日:2019.12.20
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1