本发明涉及生物,特别是涉及一种测序文库的构建方法。
背景技术:
1、构建测序文库是测序分析的关键步骤之一,文库的质量能够直接影响测序结果。测序文库中的dna或rna分子需要先经过一系列处理步骤,如加入接头、片段化、净化、富集等,才能被高通量测序仪所识别和测序。接头是构建测序文库的重要组成部分,它是一种特殊的dna分子,包含两个不同的序列,一个与dna或rna样本的3'端连接,另一个与高通量测序仪的引物连接。
2、基于illumina平台或者华大平台进行的二代测序,其建库的方法为使用a/t接头进行文库构建;该方法在接头末端仅有一个碱基突出,连接时也只有一个碱基互补;虽然在一定程度上防止了接头自连,同时也降低了连接效率。
3、酶切法建库是另一种常用的构建dna测序文库的方法,使用限制性内切酶将dna分为短片段,并将适配器连接到dna片段的末端,以便后续测序;虽然该方法使接头末端有了更多的碱基突出,提升了连接效率;但是由于限制性内切酶多为回文结构,其酶切出的粘性末端大多非一个碱基,因此可能出现接头自连的问题;测序接头自连不仅会降低其与目的片段的连接效率,同时降低了测序数据的合格率。
技术实现思路
1、基于此,有必要提供一种提高测序效率的文库构建方法,该方法能够降低接头自连率、从而提高测序接头与待测片段的连接效率和测序数据的合格率。
2、根据本发明的一个方面,提供了
3、一种测序文库的构建方法,包括如下步骤:
4、提供待测dna的酶切片段;
5、采用连接酶连接所述酶切片段和测序接头,并加入切刻酶,制备接头产物;以及
6、以所述接头产物为模板进行pcr扩增,构建所述测序文库;
7、其中,所述测序接头的核苷酸序列中包含所述切刻酶的酶切位点,所述切刻酶的酶切位点上游第一个碱基被特异性改变。
8、在其中一个实施例中,采用(a)或(b)所示的方法制备所述待测dna的酶切片段:
9、(a)采用甲基化依赖性限制性内切酶对所述待测dna进行酶切,制备酶切片段a;
10、(b)采用非甲基化依赖性限制性内切酶对所述待测dna进行酶切,制备酶切片段b。
11、在其中一个实施例中,所述甲基化依赖性限制性内切酶为fspei、mspj1或lpnpi。
12、在其中一个实施例中,所述非甲基化依赖性限制性内切酶为mspi、acii、hinp1i、hpych4iv、hpaii、clai、bsahi、sali、avai、bsiei、hpy99i、pvui、mlui、eagi、bstni或pcili。
13、在其中一个实施例中,所述酶切片段为酶切片段a的条件下,所述测序接头的5’末端突出的碱基序列为nnnn,每个n独立地选自a、t、c和g中的任一种。
14、在其中一个实施例中,所述酶切片段为酶切片段b的条件下,所述测序接头的5’末端突出的碱基序列为cg。
15、在其中一个实施例中,所述切刻酶为nt.bsmai。
16、在其中一个实施例中,所述切刻酶为nb.bsmi、nb.bsrdi、nb.btsi、ntsc.alwi、nt.bstnbi或nt.bspqi。
17、在其中一个实施例中,所述酶切片段为酶切片段a的条件下,所述切刻酶的酶切位点上游第一个碱基被特异性改变成g,所述测序接头的核苷酸序列中包括nnnnggagac。
18、在其中一个实施例中,所述酶切片段为酶切片段b的条件下,所述切刻酶的酶切位点上游第一个碱基被特异性改变成a,所述测序接头的核苷酸序列中包括cgagagac。
19、与传统技术相比,本发明具有如下有益效果:
20、本发明的测序文库构建方法,采用带有粘性末端的待测dna的酶切片段,并且在测序接头中引入切刻酶的酶切位点序列和一个可特异性改变的碱基,同时在反应体系中加入连接酶和切刻酶,使待测dna的酶切片段能够与测序接头连接。在测序接头中引入切刻酶的酶切位点序列,当接头发生自连时,切刻酶可以识别该序列并将自连的双链dna重新切割为两个与原接头相同的测序接头;此外,特异性改变切刻酶的酶切位点上游第一个碱基,能够避免接头自连时出现内切酶识别位点。采用本发明的方法,能够有效地改善测序接头之间发生自连的问题,从而提高测序接头与待测片段的连接效率和测序数据的合格率。
1.一种测序文库的构建方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的测序文库的构建方法,其特征在于,采用(a)或(b)所示的方法制备所述待测dna的酶切片段:
3.根据权利要求2所述的测序文库的构建方法,其特征在于,所述甲基化依赖性限制性内切酶为fspei、mspj1或lpnpi。
4.根据权利要求2所述的测序文库的构建方法,其特征在于,所述非甲基化依赖性限制性内切酶为mspi、acii、hinp1i、hpych4iv、hpaii、clai、bsahi、sali、avai、bsiei、hpy99i、pvui、mlui、eagi、bstni或pcili。
5.根据权利要求2~4任一项所述的测序文库的构建方法,其特征在于,所述酶切片段为酶切片段a的条件下,所述测序接头的5’末端突出的碱基序列为nnnn,每个n独立地选自a、t、c和g中的任一种。
6.根据权利要求2~4任一项所述的测序文库的构建方法,其特征在于,所述酶切片段为酶切片段b的条件下,所述测序接头的5’末端突出的碱基序列为cg。
7.根据权利要求1~4任一项所述的测序文库的构建方法,其特征在于,所述切刻酶为nt.bsmai。
8.根据权利要求1~4任一项所述的测序文库的构建方法,其特征在于,所述切刻酶为nb.bsmi、nb.bsrdi、nb.btsi、ntsc.alwi、nt.bstnbi或nt.bspqi。
9.根据权利要求8所述的测序文库的构建方法,其特征在于,所述酶切片段为酶切片段a的条件下,所述切刻酶的酶切位点上游第一个碱基被特异性改变成g,所述测序接头的核苷酸序列中包括nnnnggagac。
10.根据权利要求8所述的测序文库的构建方法,其特征在于,所述酶切片段为酶切片段b的条件下,所述切刻酶的酶切位点上游第一个碱基被特异性改变成a,所述测序接头的核苷酸序列中包括cgagagac。