本发明属于生物,更具体而言,涉及一种制备测序文库的方法和试剂盒以及相应测序方法。
背景技术:
1、随着高通量基因测序技术的发展,基因测序技术广泛应用于新基因组(de novosequencing)的组装和复杂遗传疾病的发现。基因组dna mate pair(mp)文库测序是通过大片段文库构建,从而获得基因组中较大跨度(2-30kb)片段两端的序列。这种从较大跨度两端所获得的序列对大基因组或者复杂基因组的组装和基因组结构变异发现具有非常重要的作用。mate pair文库测序的结果除了序列本身外还有中间的距离信息,距离信息可以用来判定组装后成对读长间的序列是否准确,也可用来帮助组装,这种测序方式可以用来解决基因组中的重复序列难题,被广泛采用于新基因组测序项目。此外mate pair文库跨度很大,可以检测基因的重排或者是其他染色体结构变异,在复杂遗传疾病的诊断有非常大的帮助。
2、然而,现有的mate pair文库建库步骤复杂、效率和特异性低,限制了其在临床疾病诊断中的应用。根据mate pair文库现有的建库方案,首先将基因组dna随机打断到特定大小(2-30kb),然后经末端修复、大片段两端生物素标记和平末端环化;线性消化后,环化的dna分子打断成400-600bp的片段并通过带有链亲和霉素的磁珠把带有生物素标记的片段末端捕获;这些捕获的片段再经末端修饰和加上特定接头后建成大片段文库,进行测序。mate pair文库建库的整个过程中有以下缺点:1、平末端环化效率低下,模板利用效率低,导致投入的dna量需求量大;2、链霉亲和素标记末端比较难以控制在末端,在后续捕获过程中磁珠对dna的捕获特异性较低;3、整个实验步骤多且繁琐,需要3-4天才能完成整个测序文库的制备,且成本较高。
技术实现思路
1、本发明的目的是开发一种新的mate pair的文库制备方法,能够在较少的步骤完成mate pair文库的制备,并且大幅度提高模板效率和目标片段的特异性。
2、因此,在第一方面,本发明提供了一种mate pair文库制备方法,所述方法包括,
3、1)将基因组dna片段化,生成大于1kb的片段;
4、2)将所述片段化的dna进行末端修复和加a反应;
5、3)将所述末端修复和加a后的产物的两端添加第一组接头元件,并且所述第一组接头元件在所述末端修复加a后的产物两端形成互补的粘性末端结构;
6、4)通过所述互补的粘性末端使所述步骤3)的产物环化形成双链dna环;
7、5)将所述双链dna环随机片段化,并进行末端修复和加a反应;
8、6)将所述末端修复和加a后的dna片段加上第二组接头元件;
9、7)将所述步骤6)的产物进行环化反应,形成环状产物;
10、8)使用引物对所述环状产物进行扩增,获得测序文库。
11、在一个实施方案中,其中8)所述的引物为单链寡核酸片段并且与所述第一组接头元件部分或全部序列相同或互补,利用所述引物对7)中所述环状产物进行滚还扩增,获得测序文库。
12、在一个实施方案中,其中8)所述的引物为与第一组接头元件部分或全部序列相同或互补的引物组,利用所述引物组对环状产物进行反向扩增反应,获得线性测序文库。所述线性测序文库带有第一组接头元件的pcr产物,该产物即为带有跨区域片段(2-30kb)的测序文库。
13、在一个实施方案中,在1)中,生成2-30kb或者更长的基因组片段。
14、在一个实施方案中,在3)中还包括,使用与所述第一接头元件的序列相同或互补的引物进行扩增。
15、在一个实施方案中,在3)中,所述第一组接头元件包含一个或多个酶切位点(任选的为u酶切位点)。
16、在一个实施方案中,在3)中,添加核酸内切酶,在连接第一组接头元件的dna片段两端形成互补的粘性末端结构。
17、在一个实施方案中,在3)中,所述第一组接头元件包括seq id no.1-4。
18、在一个实施方案中,在5)中,将所述双链dna环随机片段化,形成200-800bp的随机片段。
19、在一个实施方案中,在6)中,所述第二组接头元件包括seq id no.5-8。
20、在一个实施方案中,在6)中还包括,使用与所述第二组接头元件的序列相同或互补的引物进行扩增。
21、在一个实施方案中,在7)中,所述环化使用分别与所述第二组接头元件的部分或全部序列相同或互补的环化元件。
22、在一个实施方案中,在7)中还包括,使用与针对第一组接头元件的引物对对单链环进行反向pcr扩增,特异性富集带有所述第一组接头元件的模板获得足够量的dna用于后续二次环化。
23、在一个实施方案中,所述二次环化使用分别与所述第一组接头元件的部分或全部序列相同或互补的环化元件。
24、在第二方面,本发明提供了根据本发明第一方面的方法制备的文库。
25、在第三方面,本发明提供了一种mate pair文库建库试剂盒,所述试剂盒包括:
26、末端修复和加a试剂,用于对片段化的dna进行末端修复和加a反应;
27、第一组接头元件,用于添加在末端修复加a后的第一片段化的dna两端,可以形成互补的粘性末端结构;
28、第二组接头元件,用于添加在末端修复加a后的第二片段化的dna两端;
29、环化试剂,用于使添加接头元件的片段化的dna环化,形成环状产物;
30、引物,用于对所述环状产物进行扩增。
31、在一个实施方案中,本发明的建库试剂盒还包括核酸内切酶,用于切割第一组接头元件,并产生粘性末端,优选的,核酸内切酶是user酶。
32、在一个实施方案中,本发明的建库试剂盒中所述的第一组接头元件进一步包括标签序列,用于确定分子来源或者数量。
33、在第四方面,本发明提供了一种测序方法,所述测序方法包括:
34、将根据本发明第一方面得到的测序文库进行测序,获得大片段首尾的部分序列的测序结果。
35、本发明的mate pair的文库制备方法包括打断末修复、接头连接、消化环化、打断末修、接头连接、环化dnb制备或线性扩增,获得测序文库的制备等步骤,大大减少了操作复杂度。本发明的方法通过大片段粘性末端环化,模板利用效率增加,降低模板投入量。本发明的方法采用特异性引物进行反向扩增或者rca扩增,特异性富集带有跨大片段末端的序列,一个反应完成选择和富集,并且rca的特异性比常规方案(链霉亲和素法)的特异性更强。当投入量过低时,本发明的方法可采用多种扩增方式富集目标片段,其中反向pcr方法可以特异性富集跨大片段末端的序列。
1.一种mate pair文库制备方法,所述方法包括,
2.根据权利要求1所述的方法,其中8)所述的引物为单链寡核酸片段并且与第一组接头元件部分或全部序列相同或互补,利用所述引物对7)中所述环状产物进行滚还扩增,获得测序文库。
3.根据权利要求1所述的方法,其中8)所述的引物为与第一组接头元件部分或全部序列相同或互补的引物组,利用所述引物组对所述环状产物进行反向扩增反应,获得线性测序文库。
4.根据权利要求1所述的方法,在3)中还包括,使用与所述第一接头元件的序列相同或互补的引物进行扩增。
5.根据权利要求1所述的方法,在3)中,所述第一组接头元件包含一个或多个酶切位点,任选的为u酶切位点。
6.根据权利要求5所述的方法,在3)中,添加核酸内切酶,在连接第一组接头元件的dna片段两端形成互补的粘性末端结构。
7.根据权利要求1所述的方法,在3)中,所述第一组接头元件中的一条链包含标签序列。
8.将所述双链dna环随机片段化形成200-800bp的随机片段。
9.根据权利要求1所述的方法,在6)中还包括,使用与所述第二组接头元件的序列相同或互补的引物进行扩增。
10.根据权利要求1所述的方法,在7)中,所述环化使用与所述第二组接头元件的部分或全部序列相同或互补的环化元件。
11.一种mate pair文库建库试剂盒,其中包括:
12.根据权利要求11所述的试剂盒,其中所述第一组接头元件带有酶切位点,可以形成粘性末端。
13.根据权利要求11所述的试剂盒,其中进一步包括核酸内切酶,优选user酶。
14.根据权利要求11所述的试剂盒,其中第一组接头元件进一步包括标签序列。
15.一种测序方法,所述测序方法包括: