基于半导体测序平台检测BRCA1/2基因拷贝数变异的制作方法

文档序号:36485021发布日期:2023-12-25 22:42阅读:41来源:国知局
基于半导体测序平台检测

本技术属于生信分析和基因检测,具体涉及一种基于半导体测序平台检测brca1/2基因拷贝数变异的方法、生信分析方法及相应试剂盒等。


背景技术:

1、乳腺癌易感基因(breast cancer susceptibility gene,brca)是重要的抑癌基因,包括brca1(breast cancer gene 1,brca1)和brca2(breast cancer gene 2,brca2),brca1/2通过同源重组修复(homologous recombination repair)途径对dna双链断裂进行修复,若brca基因突变导致brca蛋白功能缺陷,会影响基因组的稳定性,并引起多种癌症的发生。约5%~10%的乳腺癌和15%~22%的卵巢癌是由brca1/2基因突变导致的。brca1/2基因致病性突变,使女性发生乳腺癌风险提高5倍,发生卵巢癌风险提高10~30倍。男性brca1基因突变携带者乳腺癌发病风险增加10~50倍,brca2基因突变携带这乳腺癌发病风险增加50~100倍。

2、brca1/2基因变异类型主要包括点突变、小片段插入/缺失和拷贝数变异(copynumber variations,cnv)等。目前brca1/2基因检测一般采用二代测序(next generationsequencing)技术,sanger测序使检测brca1/2基因点突变和小片段插入/缺失的传统技术,现在一般用于二代测序检测结果的验证。二代测序目前检测平台主要有illumina的miseq、hiseq和novaseq6000等,半导体测序和mgi华大制造的mgiseq2000和dnbseqt7等。半导体测序平台采用半导体芯片测序技术,无需进行基于光的碱基检测因此不需要昂贵的摄影机和仪器,不涉及dna放大步骤,简化样本制备流程更加简便。与其他仪器相比测序速度更快、低成本使其称为个人和小型实验室理想的选择。

3、多重连接依赖性探针扩增(multiplex ligation-dependent probeamplification assay,mlpa)常用于brca1/2基因cnv的检测。二代测序中通过测序策略和生物信息学工具方面也可用于cnv的检测但是不准确需要mlpa验证。该技术高效、特异,在一次反应中可以检测45个核苷酸序列拷贝数的改变,已经应用于多个领域、多种疾病的研究。mlpa由于是通过毛细管电泳技术,查看峰图识别,局限性只能检测有限位点,对于多基因检测在通量和成本上受限。

4、鉴于brca1/2基因检测有着重要的临床意义,brca1/2基因cnv检测成本高,通量低,本技术将可以区分低至1bp高至10mbp的被认为检测大片段重排的金标准的mlpa技术,结合快速简便和低成本高通量测序平台半导体测序,获得检测cnv准确、快速、低成本和高通量的方法。


技术实现思路

1、为解决上述问题,本技术所采用的技术方案如下:

2、本技术首先提供一种基于半导体测序平台的检测brca1/2基因拷贝数变异的建库探针引物组,包括与目标区域互补的左右杂交探针和通用扩增引物;

3、所述左右杂交探针序列一端包含通用序列,用于通用扩增引物扩增结合位点,一端包含特异性识别序列;

4、进一步的,每条探针长度相似,实现了扩增子扩增效率一致;

5、所述通用扩增引物序列包含部分通用序列;

6、进一步优选的,所述通用序列为测序平台通用序列。

7、进一步,所述右杂交探针的5’端含磷酸化修饰,用于可与左探针发生连接;所述通用扩增引物5’端含磷酸化修饰,用于扩增后产物可与半导体测序接头发生连接。

8、进一步,所述探针序列如seq id no.63-216所示。

9、进一步,所述通用序列如seq id no.217-218所示,所述通用扩增引物序列如seqid no.219-220所示。

10、进一步,所述建库探针引物组进一步包含质控探针,所述质控探针包含性别质控探针和内参质控探针,

11、进一步,优选的,所述质控探针序列如seq id no.1-62所示。

12、本技术还提供一种brca1/2基因拷贝数变异的检测产品,包含上述任一所述的建库探针引物组;优选的,所述检测产品为检测试剂盒。

13、本技术还提供上述任一所述的建库探针引物组的如下任一应用:

14、1)在半导体测序平台文库构建中的应用;

15、2)在基因拷贝数变异检测中的应用;

16、3)在brca1/2基因拷贝数变异检测中的应用;

17、4)在制备brca1/2基因拷贝数变异的检测试剂盒中的应用。

18、本技术还提供一种半导体测序平台文库构建用的探针引物组制备方法,所述方法包括如下步骤:

19、制备左/右杂交探针和通用扩增引物,所述杂交探针序列一端包含通用序列,一端包含特异性识别序列;所述通用扩增引物序列包含部分通用序列;

20、进一步的,每条探针长度相似,实现了扩增子扩增效率一致;

21、进一步的所述通用序列为测序平台通用序列;

22、进一步优选的,所述右探针5’含磷酸化修饰,用于可与左探针发生连接;所述通用扩增引物5’端含磷酸化修饰,用于扩增后产物可与半导体测序接头发生连接;

23、进一步的,还包括制备质控探针,所述质控探针包括性别检测探针和内参探针;性别探针作用质控样本性别,内参探针一方面归一化探针,另一方面质控实验操作过程中出现的错误。

24、本技术还提供一种基于半导体测序平台的检测brca1/2基因拷贝数变异的文库构建方法,包括如下步骤:

25、步骤1)制备建库探针引物组步骤;

26、步骤2)dna提取步骤;

27、步骤3)文库构建步骤:

28、所述步骤1)包括如下步骤:制备左/右杂交探针和通用扩增引物,所述杂交探针序列一端包含通用序列,一端包含特异性识别序列;所述通用扩增引物序列包含部分通用序列;

29、进一步的,每条探针长度相似,实现了扩增子扩增效率一致;

30、进一步的所述通用序列为测序平台通用序列;

31、进一步优选的,所述右探针5’含磷酸化修饰,用于可与左探针发生连接;所述通用扩增引物5’端含磷酸化修饰,用于扩增后产物可与半导体测序接头发生连接;

32、进一步的,还包括制备质控探针,所述质控探针包括性别检测探针和内参探针;性别探针作用质控样本性别,内参探针一方面归一化探针,另一方面质控实验操作过程中出现的错误。

33、进一步优选的,所述建库探针引物组是上述任一所述的特定序列的建库探针引物组;

34、进一步的,所述步骤3)文库构建包括:a模板变性;b变性模板与左右探针杂交;c探针连接;d连接产物扩增;e半导体测序平台接头连接和纯化;f qpcr定量。

35、本技术还提供一种基于半导体测序平台的检测brca1/2基因拷贝数变异的测序方法,包括上述步骤,并进一步包括:

36、步骤4)半导体测序步骤。

37、本技术还提供一种生信分析方法,所述方法包括如下步骤:

38、1)对测序原始序列去除通用接头序列;

39、2)对去除通用接头的测序序列重比对到人参考基因组;

40、3)对原始测序结果以及重比对结果分别进行质控;

41、4)对质控后重比对结果进行统计与拷贝数计算:

42、所述计算为:计算各样本在每个目标区域有效覆盖reads数;待检测样本内参基因区域覆盖的reads数分别与每个样本的目标区域进行比较,对每个样本各目标区域进行归一化处理;

43、a、当存在阴性样本时,所有阴性样本每个目标区域的归一化值取均值作为各区域的阴性参考值,待测阳性样本对应的每个目标区域归一化值与阴性参考值相比,计算拷贝数比值;

44、b、当不存在阴性样本时,将待测阳性样本的测序数据与通用阴性样本基线进行比较,从通用阴性样本基线中筛选出最适作为当前待测阳性样本的阴性对照样本;将筛选出的所有阴性样本每个目标区域的归一化值取均值作为各区域的阴性参考值,待测阳性样本对应的每个目标区域归一化值与阴性参考值相比,计算拷贝数比值。

45、5)根据比值计算实际拷贝数:

46、进一步的,所述1)中测序原始序列是基于前述测序方法获得测序序列;

47、进一步的,所述5)根据比值计算实际拷贝数具体参见下表比值与拷贝数关系:

48、 拷贝数 cn0 cn1 cn2 cn3 cn4 比值范围 [0,0.4) [0.4,0.65] (0.65,1.3) [1.3,1.65) [1.65,2]

49、进一步的,所述通用阴性样本基线是通过如下方法建立:

50、1)将若干数量的阴性样本进行测序,累计原始数据;

51、2)对原始数据的各项分项指标进行训练,构建阴性样本基线;所述指标包括:均一性、平均深度、gc含量和q20碱基数。

52、与现有技术相比,本技术至少具有如下优势:

53、1)本技术通过优化半导体测序的建库流程和训练数据分析软件模型等,实现多个基因外显子水平拷贝数变异同时检测,与多重连接依赖性探针扩增技术(mlpa)相比较,可准确检测的基因数目更多。在优化方面,比如探针序列设计方面,本技术根据杂交探针设计原则,反复优化探针序列,从而提高杂交效率与杂交特异性;在通用引物设计方面,左右探针一端均携带通用序列,每条探针长度相似,实现了扩增子扩增效率一致,通过半导体测序,统计每个区域序列reads数量进行数据分析,相比于mlpa使用毛细管电泳分离和填充序列长短区分不同探针,操作简单结果不受由于毛细管电泳基线漂移和泵输液不稳定等导致数据处理相对复杂的缺点。

54、2)可扩展性,半导体测序通量更高,可以补充感兴趣的基因位点,同时内参基因设计和投放多,可根据检测基因选择合适内参进行分析,数据更准确。传统mlpa检测通量有限,目标区域和内参个数合计不超过45个。

55、3)本技术优化了生信分析方法,包括分析过程中引入通用阴性样本基线建立阴性参考值,简化了实验分析流程。

56、4)有效性,本技术解决了目前brca1/2基因cnv检测通量低、检测不准确、实验周期长检测成本高的不足的问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1