专利名称:基因多态性检测方法
技术领域:
本发明是涉及以引物延伸反应为基础,可用于一个或多个位点变异的基因多态性检测、基因顺序和基因表达高低的一种分析测定方法。
基因多态性分析检测,具有广泛的理论和实用价值,包括发育学研究,生物进化研究,疾病病因分析,药物研制和新药开发,农业育种等等。在医药卫生中意义尤为重大。有些遗传病直接与基因多态性,基因表达高低相关,某些疾病则与基因表达和环境因素相互作用有关。理论认为,类似的疾病可能具有类似的基因背景或类似的基因多态性。
基因多态性中,有单碱基多态性、基因插入、基因缺失或短重复序列数目的差异。以单碱基多态性最常见。生物品种数量繁多,各品种的特性由基因所决定。在化学本质上,基因由一系列不同排列的碱基序列构成,这些碱基为A,T或U,C,G。在同一物种的不同个体中,基因结构平均每一千个碱基就有一个碱基可能不同。单个碱基的不同,称单碱基多态性。其频率在不同基因又有不同,假基因中大约为0.11%,内含子中约为0.1%,外显子中则低于0.1%。
通过多学科的合作,已有多种方法可分析检测单碱基多态性。
目前分析检测单碱基多态性的方法均遵循下述原理之一。
一是利用单个碱基的不同引起的电泳速度不同。具体方法是毛细管电泳与光谱分析相结合。较可靠,但十分费时、昂贵,且只能一次分析一个位点的单碱基多态性。
二是利用单个碱基的不同引起的碱基配对互补性不同。有三种方法实现。单碱基延长反应法,进行两次不同的引物延伸反应;检测过程在没有放大效果的第二次引物延伸反应中进行,无法避免假阴性,特别是当待测基因的碱基位点与引物3′末端相同时,单碱基延伸反应可导致极高的假阳性,此法无实用价值。最为常见的聚合酶链式反应(引物延伸反应的一种)加上凝胶电泳法,先设计碱基多态性位点的引物时,利用聚合酶链式反应进行引物延伸;完全互补的引物能延伸而不互补的引物不能延伸,延伸的引物通过凝胶电泳辩认;既可靠又敏感,它是基于对单个位点的分析、不能进行单碱基多态性多位点分析。近期,一种高密度寡核苷酸生物芯片已用于单碱基多态性多位点分析,它先对待测样品进行双向引物延伸反应,将待测样品放大扩增,然后进行延伸产物与生物芯片间的杂交利用完全互补与部分互补的杂交所产生的信号强度差来识别碱基的变异;此法检测快速、可用于大规模工业化流水作业,但敏感性和可靠性差,有20%的假阳性、10%的假阴性,高误差限制了应用范围。
本发明的目的在于避免现有技术的不足之处,而提供一种高效、敏感、可靠,且适于大规模工业流水操作的基因多态性检测方法。
可采取以下的技术方案实现目的。基因多态性检测方法,以引物延伸反应为基础;包括以下步骤a、制备待测目标基因的碱基特异性引物集合;b、进行引物集合的延伸反应;c、区分大量引物延伸产物与其他成分,其它成分包括未延伸的引物和用于引物延伸反应的dNTP混合物。用于基因多态性检测的物质包括DNA和RNA。通过酶反应延长目的基因特异性引物,再区分引物延伸反应产物与其他反应成分。
可用于一个或多个位点变异的基因多态性分析检测。用基因多态性碱基位点的特异性引物集合进行引物延伸反应,再利用单链特异性核酸酶的消化反应或基于分子量大小的简单机械分离对大量引物延伸产物进行快速分离,因此检测到的引物延伸产物可准确反映基因多态性的位点信息。
本技术方案相对现有技术具有如下优点和效果一、适用范围宽,可筛选单一标本中一个或多个基因多态性位点,筛选多个样品中一个或多个基因位点,以及测定基因多态性位点表达高低,还可通过对已知基因的顺序测定来寻找新的基因多态性位点。
二、以高度专一的多聚酶引物延伸反应为基本出发点对基因多态性测定方法改进,包括碱基特异性引物集合的设计,引物集合的3′末端标记,特异性引物集合与不同配对引物的联合使用,单方向与双方向引物延伸反应的选定,固相引物延伸反应和瀑布引物延伸反应的创造,大量引物延伸产物的快速高效分离等,从而使基因多态性测定的可靠性、高效性及适于大规模流水作业诸方面,达到较好统一;对整个基因的单位点基因多态性检测能在数小时内完成。
结合附图对本技术方案的内容作进一步详述。
图1是使用预先标记引物检测基因多态性步骤示意图。X,Y代表互补的碱基(A,T或U,C,G;其互补关系A对映T或U;C对映G),下划线(-)代表该碱基被标记。基因多态性的特异碱基的位点决定特异性引物延伸反应是否可以进行。模板碱基序列中,倒数第七位碱基(斜黑体)代表多态性碱基位点。引物1和2为检测该多态性位点的引物亚集合1为互补引物,2为不互补引物。经引物延伸反应,引物1与模板完全互补得以延伸、有延伸产物。未延伸引物2的3′末端的标记信号与模板不互补处于单链状态,被3′→5′外切酶或/和单链特异性酶消化切除。通过机械分离,去掉未延伸小分子引物、dNTPs、保留大分子引物延伸产物。
图2是使用未标记引物检测基因多态性步骤示意图。斜黑体代表多态性碱基位点。1为互补引物,2为不互补引物。使用未标记的引物检测基因多态性的标记过程在引物延伸反应时进行。引物延伸反应中单碱基反应物含有预先标记的碱基。含标记碱基的引物延伸反应产物通过凝胶电泳或严格条件洗涤,与单碱基底物和未延伸的引物区分开来。X代表在dNTPs中标记的单碱基。
相关术语描述PCR指聚合酶链式反应。
引物指与特异模板中一段碱基序列互补的寡核苷酸,长度一般在10~50个碱基之间。
聚合酶指具有合成核酸分子能力的酶,其反应温度可以是37℃,也可以高于37℃。
凝胶电泳指在电场下对生物大分子进行分离的方法,凝胶可以是变性的也可以是非变性的。
标记在这里指在核酸分子中掺入可测定的基团。标记物可以是放射性的也可以是非放射性的,比如荧光标记或酶标记。
目标基因指用来作为基因多态性分析的材料,可以是DNA也可以是RNA。
核酸包括脱氧核糖核酸和核糖核酸。
DNA指脱氧核糖核酸。
cDNA是信使RNA的互补DNA。
染色体DNA是主要的遗传物质。其与cDNA的主要区别在于后者仅仅含有外显子。
RNA指核糖核酸,包括信使核糖核酸(mRNA,转运核糖核酸(tRNA,核糖体核糖核酸(rRNA)。
mRNA指信使RNA。信使RNA是合成蛋白质的模板。同时信使RNA也常用来制备cDNA。
反义链指与信使RNA互补的碱基顺序。
体外转录指在试管中进行的从DNA到RNA的合成过程。
3′→5′外切酶指含有对双链DNA分子中3′末端具有外切活性的酶,包括DNA聚合酶Ⅰ的大分子片段,DNA外切酶Ⅲ,等。
基因多态性检测方法的具体步骤1、引物集合的设计,即待测目标基因的碱基特异性引物集合的制备。
碱基特异性引物集合包括不同引物的亚集合、每一亚集合中的引物都含有类似的碱基序列、至少有一个相应的不互补碱基、分别是A或C或G或T。其中不互补碱基位于引物3′末端或靠近3′末端处。
当一个单碱基基因多态性位点位于另外两个碱基多态性位点之间,且这三个多态性位点互相间隔不超过20个碱基数目时,退步性引物亚集合是必要的。
引物长度在18~30个碱基之间。碱基特异性引物集合为未标记的引物;或3′未端标记的引物,或多于一个碱基标记的引物。标记方法可采用放射性或非放射性。
当使用3′末端标记的引物或多于一个碱基标记的引物进行引物延伸反应时只使用未标记的dNTPs;当使用未标记的引物进行引物延伸反应时使用未标记的dNTPs与标记的碱基混合物。
引物集合为配对引物集合,或未配对引物集合;配对引物集合包括碱基特异性引物集合和与其配时的引物,未配对引物集合只包含碱基特异性引物集合。用以配对的引物可以是与待测基因互补的的一段序列,也可以是非特异性的普遍性引物。
未配对引物集合适用于单方向引物延伸反应,配对引物集合适用于双方向引物延伸,具有放大效果。
双方向引物延伸反应的碱基设计还需要考虑随后使用的反应体系和相应的检测方法。就固相瀑布引物延伸反应体系和多孔板液相延伸反应与机械分离相结合的体系中,配对引物可采用非特异的普遍性引物,也可采用多头配对的非特异性引物,即一个非特异性引物与不多于500组,最好是不多于300组碱基特异性亚集团配对。但是当液相引物延伸反应与凝胶电泳相结合时,非特异性配对引物设计则需要考虑引物延伸反应产物的长度。原则是一、碱基特异性引物的亚集合中各引物可采用不同标记方法,若不标记或采用同一种标记方法,则不同引物长度的差别应不小于一个碱基数目,最好是大于10个碱基数目;二、同一反应体系中各引物延伸反应产物的长度应不小于5个碱基,最好是大于十个碱基。
2、引物的延伸反应,即进行待测目标基因特异性引物集合延伸反应。
引物延伸反应的反应物在种类上与常规引物延伸反应相似,包括反应模板、引物、dNTP混合物,但这些反应物在性质上各有不同的要求。
模板物质可以是直接从生物体制备的DNA或RNA,也可以是通过体外转录的cDNA或者是体外扩增的基因片段产物。当染色体DNA直接用于引物延伸反应时,应用限制性内切酶如EcoRⅠ进行不完全消化或使用超声波降解,使DNA达到分子量在1~20kb之间,增加引物延伸反应的效率。
引物延伸反应,使用DNA聚合酶包括DNA依赖性DNA聚合酶和RNA依赖性DNA聚合酶;在37℃或37℃以上进行。
单方向和双方向引物延伸反应均可用于基因多态性分析。单方向引物延伸反应只需碱基特异性引物,双方向引物延伸反应则要求配对引物。引物延伸反应聚合酶的选择和反应详细条件的确定已公知,视反应目的而定。双向引物延伸反应的主要控制条件包括模板失活,引物与模板退火反应,引物延伸。增加反应循环次数是提高反应效率的常用方法。液相引物延伸反应时,循环次数可控制在20~40次之间。固相引物延伸循环次数可控制在30~50次之间。
退火温度在引物延伸反应中起着十分关键作用。退火温度过高反应不能进行,过低则引物延伸反应的特异性和可靠性下降。退火温度计算以熔化温度Tm为参考Tm=4X(G+C)+2X(A+T)。例一个含有十个A,T和十个G,C的二十个碱基引物,其熔化温度Tm=4X(10)+2X(10)=60℃。
引物延伸反应时,先将碱基特异性引物集合固定在特定的固相上进行固相引物延伸反应,或将碱基特异性引物集合直接加入液相中进行液相引物延伸反应。固相引物延伸反应以液相引物延伸反应的产物作为引物延伸反应模板。用于共价固定的方法包括紫外线照射,热烘烤,和化学反应连接。可用于固相引物延伸的碱基特异性引物包括未标记引物或3′末端标记引物。
上述退火温度的计算基于液相引物延伸反应,不适于固相引物延伸反应。当碱基特异性引物共价固定于固相之后,引物与固相的结合是牢固的,而碱基特异性引物与引物延伸反应模板之间的氢键结合,仅仅能够承受碱基特异性引物随着模板在液相中以单一分子形式做随机热运动。按照液相延伸反应计算的退火温度下的随机热运动足以破坏固定的碱基特异性引物与模板之间微弱的氢键结合。理论上,降低退火温度是一种解决方案,另种方案是增加碱基特异性引物的长度,但降低退火温度和增加碱基特异性引物长度所允许的空间十分有限。为此,可采用本发明的引物延伸反应方法-瀑布引物延伸反应法。
瀑布引物延伸反应的体系使用与液相双向引物延伸反应相同的引物对集合。因这种引物集合在固相引物延伸反应的效率较低,使用预先共价固定于固相的碱基特异性引物外,在反应体系中同时加入1%~1‰低浓度的碱基特异性引物,在液相反应体系中,先进行高效率的液相引物延伸反应。即能使引物延伸模板大量扩增,又缩短了模板的长度。增加引物延伸反应的模板是增加固相引物延伸反应效率的有效方式之一。制约固相引物延伸反应的另一因素是退火温度,如何在同一反应体系中同时或前后不久进行液相与固相两种引物延伸反应中找到一个合理的退火温度。瀑布引物反应解决了这一难题。首先、用于瀑布引物反应的引物对,以其反应产物不长于300碱基对,最好是不长于100碱基对为原则,使固定于固相的引物与短模板间形成的微弱氢键结合能在相应的退火温度下处于较稳定的状态。其次、瀑布引物延伸反应简化了反应过程,常规测定方法中先进行液相引物延伸反应,再进行第二次液相引物延伸反应或杂交反应;瀑布引物延伸反应,液相引物延伸反应的产物作为固相引物延伸反应的模板,后者是对基因多态性分析的重要步骤。无论是液相引物延伸反应还是固相引物延伸反应,目前已有多种商品化的PCR仪器可利用。
3.有用信号与无用信号的分离,即区分大量引物延伸产物与其他成分,其它成分包括未延伸的引物和用于引物延伸反应的dNTP混合物。
高背景噪音是现有生物芯片有待解决的问题。本技术去除了标记物与固相非特异性的结合及常规分析方法中探针与目标基因之间的非特异性结合。本技术中唯一可能存在的噪音来自于未完全洗涤干净的标记物,可能引起背景噪音的标记物为单碱基分子,来源,一是直接添加于反应体系之中含有标记信号的dNTPs混合物,另一是整合于标记引物上的标记物,后者在单链特异性酶消化后,标记物仍以单碱基形式存在。
采用严格的洗涤条件,如0.5X的SSC每次洗涤5分钟,重复三次洗涤足以去除反应体系残存的单碱基标记物。这种单碱基标记物造成的背景信号,只对固相引物延伸反应有影响,对液相引物延伸反应的影响全无或甚微。
含有标记碱基的引物延伸产物以单链特异性核酸酶,或3′→5′外切酶消化方式与未延伸引物分离。
共价结合于特定固相上的标记引物在固相引物延伸反应后有两种结果。碱基特异性引物与模板完全互补时,部分碱基特异性引物得到延伸,延伸的长短由配对引物控制;而延伸的碱基特异性引物的比例,则取决于固相引物延伸反应的效率。碱基特异性引物在3′末端与模板有不完全互补碱基存在时,引物延伸反应不能进行。固相引物延伸反应完成后反应体系逐步降温至20℃左右,使反应体系中互补的核酸分子形成双链结构。这一复性过程可持续20~40分钟。完全复性后,使用50-200单位/毫升的S1酶处理反应系统。S1酶消化反应控制在30~35℃,消化时间5~25分钟,不宜长于1小时避免双链分子被消化。另一选择是DNA外切酶Ⅲ在37度消化10分钟。消化之后可使用0.5倍浓度的SSC洗涤三次,每次5分钟。
含有标记碱基的引物延伸产物以不同大小分子量截留的分子筛离心方式与没有延伸的引物和dNTPs混合物分离。
对液相引物延长反应,机械分离可十分有效的分离已延伸产物与单碱基标记物或标记引物。根据延伸产物分子量远大于未延伸引物和dNTP的特点,利用不同截留大小的分子筛,能使这一分离过程简单、快速和高效。在机械分离之前采S1或3′→5′外切酶消化并与严格洗涤相结合,对增加信号/噪声比值有所帮助。
引物延伸产物通过凝胶电泳与未延伸引物和dNTPs混合物分离。
当液相引物延伸反应的结果分析采用单纯光学扫描装置时,机械分离为主要手段,而当液相引物延伸反应与凝胶电泳相结合时,机械分离和严格条件下的洗涤,不是必须的,尽管其能在一定程度上增加信号/噪声比值。凝胶电泳分离PCR产物的方法已众所周知,分离产物的检测包括溴化锭显色,荧光扫描,放射自显影,以及其他酶化学反应等多种显像手段。
常规凝胶电泳技术,其分辨率无法分析含有大量基因多态性位点的结果,如1000个甚至10000个多态性位点。本发明适用不同波长荧光标记的引物与不同长度引物延伸产物相结合的设计,大大增强凝胶电泳的分析能力。如使用十种不同波长的荧光标记引物,每种荧光用于标记20~50对,可得到不同长度产物的不同引物。这种设计与96孔板结合,一次聚丙烯凝胶电泳就能分析至少9600种单位点基因多态性。
考虑到荧光标记与检测的仪器依赖性,使用未标记的引物,本发明仍能通过引物延伸反应与凝胶电泳相结合,一次分析上百种或多于1000种单位点基因多态性。
4、显像与检测对荧光标记的引物延伸反应,不需要额外的显象过程,直接扫描即可得到标记信号。对放射标记的引物延伸反应,可通过放射自显影,或放射活性测定仪测定;对化学发光标记,可用化学发光仪检测。化学发光法常需要先进行相关显像化学反应。检测到的信号视信息量大小决定其处理方法,小量信息可用手工处理,大量信息则需计算机辅助分析。可用客户自编程序、商业化的相关程序或用户专用程序。
权利要求
1.一种基因多态性检测方法,以引物延伸反应为基础,其特征在于,包括以下步骤a、制备待测目标基因的碱基特异性引物集合;b、进行引物集合的延伸反应;c、区分大量引物延伸产物与其他成分,其它成分包括来延伸的引物和用于引物延伸反应的dNTP混合物。
2.如权利要求1所述的基因多态性检测方法,其特征在于碱基特异性引物集合包括不同引物的亚集合、每一亚集合中的引物都含有类似的碱基序列、至少有一个相应的不互补碱基、分别是A或C或G或T。
3.如权利要求1,2所述的基因多态性检测方法,其特征在于引物集合为配对引物集合,或未配对引物集合;配对引物集合包括碱基特异性引物集合和与其配对的引物,未配对引物集合只包含碱基特异性引物集合。
4.如权利要求3所述的基因多态性检测方法,其特征在于碱基特异性引物集合为未标记的引物,或3′末端标记的引物,或多于一个碱基标记的引物。
5.如权利要求4所述的基因多态性检测方法,其特征在于当使用3′未端标记的引物或多于一个碱基标记的引物进行引物延伸反应时只使用未标记的dNTPs;当使用未标记的引物进行引物延伸反应时使用未标记的dNTPs与标记的碱基混合物。
6.如权利要求1所述的基因多态性检测方法,其特征在于引物延伸反应时,先将碱基特异性引物集合固定在特定的固相上进行固相引物延伸反应,或将碱基特异性引物集合直接加入液相中进行液相引物延伸反应。
7.如权利要求6所述的基因多态性检测方法,其特征在于固相引物延伸反应以液相引物延伸反应的产物作为引物延伸反应模板。
8.如权利要求6所述的基因多态性检测方法,其特征在于引物延伸反应使用DNA聚合酶包括DNA依赖性DNA聚合酶和RNA依赖性DNA聚合酶,在37℃或37℃以上进行。
9.如权利要求1,5所述的基因多态性检测方法,其特征在于含有标记碱基的引物延伸产物以单链特异性核酸酶,或3′→5′外切酶消化方式与未延伸引物分离。
10.如权利要求1,5所述的基因多态性检测方法,其特征在于含有标记碱基的引物延伸产物以不同大小分子量截留的分子筛离心方式与没有延伸的引物和dNTPs混合物分离。
11.如权利要求1,5所述的基因多态性检测方法,其特征在于引物延伸产物通过凝胶电泳与未延伸引物和dNTPs混合物分离。
全文摘要
本发明是涉及以引物延伸反应为基础,可用于一个或多个位点变异的基因多态性、基因顺序和基因表达高低的一种分析测定方法。以引物延伸反应为基础;包括以下步骤:a、制备待测目标基因的碱基特异性引物集合;b、进行引物集合的延伸反应;c、区分大量引物延伸产物与其他成分,其它成分包括未延伸的引物和用于引物延伸反应的dNTP混合物。使基因多态性测定的可靠性、高效性及适于大规模流水作业诸方面,达到较好统一。
文档编号C12Q1/68GK1312386SQ0110415
公开日2001年9月12日 申请日期2001年2月22日 优先权日2001年2月22日
发明者张佳, 李凯 申请人:张旭