短串联重复序列测序方法和分析方法与流程

文档序号:38386412发布日期:2024-06-21 20:33阅读:62来源:国知局
短串联重复序列测序方法和分析方法与流程

本发明涉及生物领域。具体地,本发明涉及短串联重复序列测序方法和分析方法。


背景技术:

1、短串联重复序列(short tandem repeat,简称str),也称为微卫星dna(microsatellite dna)或简单重复序列(simple repeat sequence,srs;simplesequences of repeats,ssr)。由于核心单位(也称为“重复单位”或“基序序列”)及其重复次数的不同,str在不同种族、不同人群、不同个体之间的分布具有很大的差异性,构成了str的遗传多态性。在人类基因组中,平均每15~20kb就存在一个str位点,人类23对染色体上分布着近8000多个str位点[马威,张亮,李岩,徐飞.人类短串联重复序列(str)及其研究进展[j].大连医科大学学报,2007,29(1):78-81.]。鉴于多态性和广泛分布,str位点可作为特异性高、灵敏度强的遗传标记。结合pcr技术,str检测已经广泛应用于遗传制图、基因定位、法医鉴定、产前诊断等许多领域。例如在法医的身份鉴定领域,目前主要使用大约几十种常染色体str和y-染色体str。

2、检测str的方法主要包括pcr和测序,基于测序的str检测方法仍有待研究或改进。


技术实现思路

1、本发明旨在至少在一定程度上解决上述技术问题至少之一或者提供一种实用的str检测方案。在本发明的一个方面,本发明提出了一种短串联重复序列(str)测序方法。根据本发明的实施例,方法包括:获取文库,所述文库的插入片段中含有短串联重复序列和与所述短串联重复序列相连的特异性序列;在固相表面上对所述文库进行边合成边测序,以便获得测序数据,所述测序数据包括多个读段,其中,所述固相表面携带第一测序引物和第二测序引物的至少之一,所述第一测序引物具有下列核苷酸序列:(s0)x,其中,所述s0表示所述短串联重复序列的基序序列或其互补序列,x不小于1,所述第二测序引物具有下列核苷酸序列:s1-(s0)y,其中,s1为所述特异性序列或与所述特异性序列对应的序列,s0为所述短串联重复序列的基序序列或其互补序列,y大于或等于0。

2、常规的测序引物通常不含待测序列,例如商业化的边合成边测序方法或平台,如illumina、华大智造、thermofisher等的测序平台,所采用的测序引物通常是据文库末端的接头设计的,为能够与接头或接头的一部分匹配的序列,据此,基于引物延伸和相应的信号检测识别部分或全部的插入片段/待测序列的碱基类型和排列次序。

3、不同于上述常规的测序引物,发明人基于以下认识、预测和测试发现目标序列str由2-6个碱基的重复单位串联构成以及短串联重复序列之间的“错位杂交”行为基本是随机发生的,因而,巧妙地设计出了该第一测序引物。具体地,使第一测序引物例如为待测序列的一部分,例如为由数个目标str的重复单位(基序序列)串联形成的多核苷酸序列,而鉴于测试发现该第一测序引物杂交匹配到包含目标str的文库的不同位置(亦即错位杂交)具有一定的随机性,因此,利用该第一测序引物捕获或杂交该文库,可以理解地,会产生一系列杂交复合物。进一步地,延伸该第一测序引物对该些杂交复合物进行测序,测序数据将包含对应该些杂交复合物或者说对应目标str不同位置的多种读段(reads),进而,通过对该测序数据的分析可以确定目标str的完整序列,亦即确定该str的基序序列的重复次数,实现对该str的分型。

4、类似地,也是基于上述认识、预测和试验测试,发明人巧妙地设计出第二测序引物,使第二测序引物例如为包含特异性序列或与特异性序列对应的序列以及一个或数个目标str的重复单位(基序序列)串联形成的多核苷酸序列,例如,利用5’端固定在指定表面的第二测序引物5’-s1-(s0)y-3’捕获或杂交包含目标str的文库,能获得5’端为双链的杂交复合物,也就是说,第二测序引物和该文库的杂交互补位置一端是固定的,如此,可进一步对该杂交复合物进行测序,以确定该str的序列,实现对该str的检测。

5、更具体地,设计使该第二测序引物包含一组不同长度的序列,并且使其中的每种长度的序列分别包含特异性序列或与特异性序列对应的序列以及不同长度的(s0)y,亦即y具有多个不同取值的一组序列,可以理解地,利用该组序列捕获或杂交包含目标str的文库,能获得5’端为双链的一系列杂交复合物,对该些杂交复合物进行测序,可以理解地,测序数据将包含对应该些杂交复合物或者说对应目标str不同位置的多种读段(reads),进而,通过分析该测序数据可以确定该str的完整序列,亦即确定该str的基序序列的重复次数,准确地实现对该str的分型,缩短测序时间,节省测序成本,应用前景好。

6、在本发明的另一方面,本发明提出了一种确定短串联重复序列的方法。根据本发明的实施例,方法包括:(i)获取短串联重复序列的测序数据,测序数据是根据前面所述短串联重复序列测序方法获得的;(ii)将测序数据与参考序列进行比对,以便将多个读段分类为测穿读段和未测穿读段,测穿读段包含特异性序列或特异性序列的互补序列的至少一部分,未测穿读段不包含特异性序列或特异性序列的互补序列;和(iii)基于测穿读段和未测穿读段,确定短串联重复序列。

7、在本发明的又一方面,本发明提出了一种测序芯片。根据本发明的实施例,测序芯片包括:基底,具有表面;第一测序引物,第一测序引物固定在表面上,并且,第一测序引物具有下列核苷酸序列:(s0)x,其中,s0表示所述短串联重复序列的基序序列或其互补序列,x不小于1。

8、在本发明的又一方面,本发明提出了一种测序芯片。根据本发明的实施例,测序芯片包括:基底,具有表面;第二测序引物,第二测序引物固定在表面上,并且,第二测序引物具有下列核苷酸序列:s1-(s0)y,其中,s1为特异性序列或者与特异性序列对应的序列,s0为短串联重复序列的基序序列或其互补序列,特异性序列能够指示短串联重复序列在参考序列上的位置,y大于或等于0。

9、在本发明的又一方面,本发明提出了一种试剂盒。根据本发明的实施例,试剂盒包括:(1)如前面所述短串联重复序列测序方法中的第一测序引物和/或第二测序引物;或(2)如前面所述的芯片。

10、在本发明的又一方面,本发明提出了一种识别个体的方法。根据本发明的实施例,方法包括:根据前面短串联重复序列测序方法,确定待测样本的短串联重复序列的序列,待测样本包含核酸;基于序列,确定待测样本源自的一个或多个个体。

11、本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。



技术特征:

1.一种短串联重复序列测序方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述固相表面携带所述第一测序引物,表示为:

3.根据权利要求1所述的方法,其特征在于,所述固相表面携带所述第二测序引物,表示为:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述第一测序引物的长度大于20nt,和/或所述第二测序引物的长度大于20nt;

5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:

6.一种确定短串联重复序列的方法,其特征在于,包括:

7.根据权利要求6所述的方法,其特征在于,在步骤(ii)中,通过下列方法确定测穿读段和未测穿读段:

8.一种芯片,其特征在于,包括:

9.根据权利要求8所述的芯片,其特征在于,所述第一测序引物具有下列结构:

10.一种芯片,其特征在于,包括:

11.根据权利要求10所述的芯片,其特征在于,s1衍生自下列的至少之一:

12.一种试剂盒,其特征在于,包括:

13.一种识别个体的方法,其特征在于,包括:


技术总结
本发明提出了短串联重复序列测序方法,该方法包括:获取文库,文库的插入片段中含有短串联重复序列和与短串联重复序列相连的特异性序列;在固相表面上对文库进行边合成边测序,以便获得测序数据,测序数据包括多个读段,其中,固相表面携带第一测序引物和第二测序引物的至少之一,第一测序引物具有下列核苷酸序列:(S0)x,第二测序引物具有下列核苷酸序列:S1‑(S0)y,其中,S1为特异性序列或与特异性序列对应的序列,S0为短串联重复序列的基序序列或其互补序列,x不小于1,y大于或等于0。利用本发明的方法可以准确地实现STR的分型,缩短测序时间,节省测序成本,应用前景好。

技术研发人员:孙雷,尚欢,金欢
受保护的技术使用者:深圳市真迈生物科技有限公司
技术研发日:
技术公布日:2024/6/20
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1