专利名称:基因型分型的制作方法
技术领域:
本发明涉及使试样中存在的靶分子的一个或多个基因座基因型分型(genotyping)的方法。此外本发明涉及用于进行所述方法的试剂盒。本发明还涉及用于设计和生产选择引物的方法和用于生产检测引物的方法,两种方法在所述基因型分型方法或所述试剂盒中使用。此外本发明涉及选择引物本身,以及涉及将辅助设计选择引物的计算机程序产品。
背景技术:
在遗传研究或在传染病诊断中,重要的任务是确定和分类在落入控制表型的重要特征的两个类别中的基因组特定区域的核苷酸序列。这种情况的引物的实例为禽流感病毒(AIV)血凝素(haemagglutinin)前体蛋白(HAO)的裂解位点,其为低或高致病性病毒的一种特征。高致病性AIV的HAO裂解位点包含具有最小基序R/K-X-R/K-R丨G的多个碱性氨基酸侧链,迄今为止仅发现于H5和H7亚型1O事实上,已显示大量病毒具有需要翻译后裂解来激活感染的表面蛋白2,所述病毒包括重要的病原体如人类免疫缺陷病毒I型、丝状病毒依波拉(Ebola)和马尔堡(Marburg)以及黄病毒,如黄热病病毒。这些病毒中的许多具有类似于禽流感病毒的基序的裂解位点基序,并且存在多种已阐明致病性和裂解性之间的相互关系的病毒U2。基于密码子表达,在RNA水平上,AIV高致病性裂解位点基序可由超过18,000种不同序列表示。随着之前未知的裂解位点序列的不断涌现,在不同的H5和H7亚型病毒和新病毒中已发现几百种可能的这些序列。为此,在PCR应用中用探针检测裂解位点的尝试已被局限于流感病毒亚组(subset)3—6,目前用于AIV致病性的分子试验的标准方法涉及裂解位点的核苷酸测序3’7。因此,用于AIV致病型分型(pathotyping)的单管试验能够避免繁琐、耗时以及在技术上需要核苷酸测序,对于快速筛选和诊断应用,必须能够以高度多样的方式询问(interrogate)试样。区分大组(set)基因组序列的主要问题是设计用于获得全部识别的靶片段的同源扩增(homogeneous amplification)的多重扩增方法8和抑制引物间的相互作用。例如通过使用HANDS (同标记辅助的非二聚体体系,homo-tag AssistedNon-Dimer System)技术已尝试对引物间的相互作用进行抑制,其中对嵌合引物(在这些方案中其有效地使扩增达到可检测的水平)上存在的通用标记靶向的互补链(complement)的通用引物为较高浓度的同时,嵌合引物(用通用序列标记的序列识别引物)以相对低的浓度存在9。由于相同的通用标记序列使各嵌合引物对的正向和反向引物均延伸,所以在几个PCR循环后扩增产物的末端将自身互补。对于短的、非靶标依赖的引物二聚化产物,将偏向于形成分子内“锅柄式(panhandle) ”结构,这将保护3’端并进一步防 止引物二聚体的扩增9。引物二聚体的抑制将允许更高的多重化。对于多重检测在采用PCR抑制概念11的相关方案中,将通用引物靶标(衔接子(adaptor))连接到基因组DNA的末端。通过使用一个所有多重反应共用的靶向衔接子区的引物和一个对各多重组分反应靶向特异的引物来实现多重扩增。提出了两种机制来解释该方法所记载的多重效率' 首先,由于衔接子引物对于全部反应都是相同的,因此反应中使用的引物的数量减少,降低不期望的引物相互作用。其次,由衔接子引物单独引起的假性扩增将产生具有自身互补末端的扩增子,因而会形成锅柄式结构,所述结构的进一步扩增将以与HANDS法中针对引物二聚体所提出的方式相同的方式而受到抑制9。随后,通用引物的使用已在多种方法如多重微阵列增强的PCR12、Templex PCR13、巢式膜片PCR(nested patch PCR)14中,以及在以连接为基础的多重扩增方法如多重连接依赖性探针扩增15和基于序列标记的分子倒位(inversion)探针的分析16中发现许多用途。虽然在本领域中已作出了努力,但仍存在对提供使大组基因组序列中全部识别的靶片段同源扩增的新方法的需要
发明内容
本发明的目的为提供一种通过组合多种上述主题以新方式来解决前述区分大组基因组序列的问题的新方法。根据本发明,通过半巢式法来实现大组基因组序列的区分,所述半巢式法包括预扩增和二级扩增反应,并将识别和检测事件分离。一方面,本发明涉及使试样中存在的靶核酸分子内的N个基因座基因型分型的方法,其中所述基因座各自位于核酸分子的基因型标记物区,并对应于两个或多个基因型。在第二方面,本发明涉及用于进行所述基因型分型方法的试剂盒,所述试剂盒包括引物和可选地核酸扩增反应混合物的其他成分。在第三方面,本发明涉及用于设计和生产选择引物的方法,所述选择引物将用于基因型分型的方法或进行基因型分型方法的试剂盒中。在第四方面,本发明涉及用于生产检测引物的方法,所述检测引物将用于基因型分型的方法或进行基因型分型方法的试剂盒中。在第五方面,本发明涉及适合于靶核酸分子中基因座的基因型分型的选择引物。在第六方面,本发明涉及用于设计选择引物的计算机程序产品。进一步,特别参考附图,将更详细地描述本发明的优势和目的。
图I示出基因型分型方法的预扩增步骤a)的一个实施方案的概括图,其中某些引物用人工序列标记。图2示出基因型分型方法的步骤b)的一个实施方案的概括图,其中将一个基因座基因型分型为相应的四个基因型。选择引物(正向引物)二分(bipartite)为基因座识别序列部(I)和人工两片式标记序列部(2),所述人工两片式标记序列部的其中一片为由用于阵列杂交的非结构DNA短片段(structure free DNA word)构成的基因型特异性序列,另一片为所有二分选择引物共有的非基因型特异性序列(3)。检测引物(正向引物)对所有基因型共有,并对应于选择引物的非基因型特异性序列。反向引物对于选择和检测均相同。DNA短片段(条码序列)对应于可读出阵列(readout array)上的序列。通常,阵列携带有与DNA短片段相同的序列,从而避免二分引物的直接结合,并且结合将需要一轮PCR扩增以便产生DNA短片段的互补链。图3示出基因型分型方法的步骤b)的一个实施方案的概括图,其中一个基因座将要基因型分型为对应于流感病毒的两个基因型(HP=高致病性,LP=低致病性)。选择引物(正向引物)二分为基因座识别部分(I)和人工一片式(one-piece)基因型特异性标记序列部(2)。对应于各基因型,使用两种检测引物(正向引物),并分别用标签I和标签2标记。对于选择和检测,反向引物均相同。图4示出基因型分型方法的一个实施方案的方案概括图。这里,所述方法为用于禽流感病毒(AIV)致病型分型的半巢式预扩增和二级实时PCR法。三角形表示裂解位点,SP将要基因型分型的基因座。黑色箭头表示预扩增引物。将用于识别高和低致病性病毒的裂解位点特性的二分选择引物组描述为与象征靶识别序列组的矩形区域相连接的锅柄形状。检测引物显示为用标签标记的锅柄形状。实线和虚线分别表示引物是否典型地识别/检测到高或低致病性病毒的裂解位点。自身互补的锅柄形状起到最小化引物-引物相互作用的目的。 图5示出显示对于H5 (a)和H7 (b)AIV致病型分型,用P丨ex()I· 检测引物获得的两个通道(‘JOE’/’FAM’)中的荧光信号的标准化比值的扩增曲线。标出了所研究的AIV分离株。全部分离株的致病性是预先已知的(表1(H5)和表2(H7))。分别用实线和虚线表示高和低致病分离株。将试验构建为产生高致病性的阳性信号和低致病性的阴性信号,并使用380个选择引物。在(b)中错误地致病型分型的两个分离株为A/绿头鸭/瑞典/123455/08 (H7N7)和 A/ 绿头鸭 / 瑞典 /100993/08 (H7N7)。图6示出显示为对于2008EU成环试验(ring trial)的致病型分型,用Plexoi^,检测引物获得的两个通道(‘JOE’/’FAM’)中的荧光信号的标准化比值的扩增曲线。图中标出了所研究的AIV分离株。通过裂解位点测序确定全部分离株的致病性(表1(H5)和表2(H7))。分别用实线和虚线表示高和低致病分离株。将试验构建为产生高致病性的阳性信号和低致病性的阴性信号,并利用380个选择引物。图7示出显示为对于图中所示的四种AIV分离株的致病型分型,用P丨exC)1,检测引物获得的两个通道(‘JOE’/’FAM’)中的荧光信号的标准化比值的扩增曲线。没有或有叉的曲线是分别通过使用380个和382个选择引物组的试验来获得的。通过裂解位点测序确定全部分离株的致病性(表1(H5)和表2(H7))。分别用实线和虚线表示高和低致病分离株。将试验构建为产生高致病性的阳性信号和低致病性的阴性信号。图8示出显示为对于使用预扩增用pan-HA引物2°的致病型分型,用Plexor^检测引物获得的两个通道(‘J0E’ /’ FAM’ )中的荧光信号的标准化比值的扩增曲线。使用382个选择引物组进行图中所示分离株的致病型分型的试验。通过裂解位点测序确定全部菌株的致病性(表1(H5)和表2(H7))。分别用实线和虚线表示高和低致病分离菌。将试验构建为产生高致病性的阳性信号和低致病性的阴性信号。图9示出382个选择引物中解链温度(a)和长度(b)的分布。HP和LP分别表示检测高和低致病性病毒的裂解位点的引物。图10示出从美洲分离株获得的扩增曲线,其显示为对于使用源自2009年12月ncbi序列数据库的覆盖世界上全部裂解位点的延伸的468个选择引物组的致病型分型,用Plexor 检测引物获得的两个通道(‘JOE’ Γ fam’ )中的荧光信号的标准化比值。通过标准方法证实全部菌株的致病性。分别用实线和虚线表示高和低致病分离株。一个分离株用长虚线表示,为低致病性但携带高致病性病毒典型的裂解位点。还通过所述方法的设计将该分离株检测为高致病性。将试验构建为产生高致病性的阳性信号和低致病性的阴性信号。细线试样为阴性,并为美洲H7型。所设计的预扩增引物为H7和H5特异的,在该图中,使用的是H5特异性引物。图11示出显示为对于新城疫病毒(NDV)的致病型分型,用Plexm-K检测引物获得的两个通道(‘JOE’/’FAM’)中的荧光信号的标准化比值的扩增曲线。中等毒株(长虚线)和强毒株(实线)被认为是高致病性的,而轻型毒株(短划线)是低致病性的。使用252个选择引物组进行图中所示的分离株的致病型分型的试验。文献中预先已知25个分离株的致病性,对其他5个分离株(SD2C2、SA1C、LK2p、WARW和MX4)的裂解位点测序。将试验构建为产生高致病性的阳性信号和低致病性的阴性信号。
具体实施例方式定义在本申请和发明的上下文中,采用以下定义如本文所使用的,术语基因型分型广义上是指在特定的多态性基因座或基因组位置处确定特定的一个或多个核苷酸(如序列变异)存在与否的方法。术语基因型是指细胞、个体或有机体的遗传构造(constitution)。术语基因座是指基因或核酸序列例如任何来源如源自真核生物、原核生物等的染色体DNA或RNA的具体位置。在细菌类型中,基因座可被位于除染色体DNA以外的可动遗传因子如质粒、转座子、耐药基因盒(resistance cassettes)和毒性基因,基因型分型将包括确定这些因子的存在和本质或者不存在这些因子,以及将染色体基因座基因型分型。如本文所使用的,术语试样是指包含待检测或分析的材料的组合物。试样包括生物试样,所述生物试样是指从活体来源,例如动物如人类或其他哺乳动物、植物、细菌、真菌、原生生物或病毒所获得的任何材料,或者加工形式例如扩增或分离的材料。在该上下文中,术语靶向和结合,以及由其衍生的词语,意于表示,在引物在严格条件下可杂交的地方或在该地方相对应的位点的事件。术语基因型标记物区是指其序列或存在表示有机体的性质的基因组区域,所述性质例如基因型、毒性/致病性、可动遗传因子的存在、特定基因的存在、耐抗生素性(resistance of antibiotics)等。如本文所使用的,术语扩增(amplifying或amplification)是指增加生物聚合物、特别是核酸的量。基于所选择的5’和3’引物,扩增还用于限制和定义进行分析的基因组的靶区域或基因座。可通过任何本领域技术人员已知的方法进行扩增,在具体的实施方案中包括聚合酶链式反应(PCR)的使用。术语预扩增是指靶向DNA遗传材料的扩增系统,优选PCR系统,其可为来自待确定基因型,例如禽流感致病型的有机体的反向转录RNA。术语引物是指扩增期间与核酸序列杂交的寡核苷酸。术语正向引物是指具有与基因的编码链相同的序列或嵌合连接到所述编码链的人工序列的引物,术语反向引物是指具、有与基因的编码链互补的序列或与嵌合连接到编码链的互补链的人工序列互补的引物。选择引物用于选择扩增系统、优选PCR系统,将该系统构建为靶向由预扩增扩增系统所提供的模板的扩增系统。反向或正向引物通过二分引物以多重方式靶向确定所分析的性质的区域,所述二分引物的5’端区域根据通过识别二分引物的3’端部分的序列所表示的基因型的性质由不同种类的人工序列元件组成。相对应的反向/正向引物可以是或可以不是多重的。检测引物用于检测扩增系统、优选PCR系统,将该系统构建为靶向由选择扩增系统所提供的模板的多重扩增系统。反向或正向引物可用标签或化学部分来标记以便检测。术语扩增子是指形成为天然或人工扩增事件的产物的DNA片段。
术语核酸和核酸分子可贯穿本公开互换使用。所述术语是指单链或双链形式的脱氧核糖核苷酸(DNA)、核糖核苷酸聚合物(RNA)和RNA/DNA杂交物(hybrid)。短语同步扩增是指同时扩增2个以上的基因座或核酸靶区域。同步扩增典型地在相同的扩增混合物中。尽管本文预期同步扩增可发生在分离的反应混合物中,但对于本文所提供的方法,同步扩增反应典型地发生在相同的单一反应中。如本文所使用的,术语多重是指超过一个寡核苷酸或引物的同步扩增或引物大规模延伸反应(例如,在单一反应容器中);或超过一个寡核苷酸的同步分析,例如在阵列读取装置中;或通过多重引物对试样的同步询问。如本文所使用的,短语靶核酸是指一个或多个核酸,如基因组DNA,从该核酸将扩增一个或多个区域或基因座。如本文所使用的,术语多态性是指核酸,例如基因或其部分共存超过一种形式或等位基因。例如,至少存在两个不同的等位基因,即,两个不同的核苷酸序列的基因的一部分或基因座,被称为基因的多态性基因座、位点或区域。多态性基因座在长度上可为单核苷酸(例如,SNP)或可为若干个核苷酸(例如,禽流感裂解位点,插入或缺失)。因此,多态性包括核苷酸的取代、插入、重复和缺失。多态性还可指发生在特定多态性位点的一个或多个特定核苷酸或核苷酸序列。本发明的详细说明第一方面本发明涉及将试样中存在的靶核酸分子中的N个基因座基因型分型的方法,其中N至少为1,所述基因座各自位于核酸分子的基因型标记物区,并对应于两个或多个基因型、优选两个基因型。所述方法包括以下步骤a)至C)。在步骤a)中,利用引物依赖性酶促反应进行各基因型标记物区的预扩增。用由第一组的一个或多个不同正向引物和第一组的一个或多个不同反向引物所组成的第一批(group)扩增引物对进行预扩增,产生一个或多个包含基因型标记物区的扩增子。所述扩增子各自包含具有可充当不同于基因型标记物区的引物结合靶标的至少一个核酸序列的区域。预扩增可在N个单独的单一反应或在单一的N重反应中或这些极端条件之间的任何反应中实现。可充当引物结合靶标的核苷酸序列,优选长为10-40个核苷酸,属于具有小于100个成员、优选小于20个成员和更优选I至5个成员的序列的组。可通过使保守基因组区存在于扩增子、或通过使用酶促连接的人工序列例如通过连接或通过使用含有人工5’端部分的二分PCR引物,或这些机制的组合来实现所述组的序列。图I描述了预扩增步骤a)的一
些实施方案。试样为含有待基因型分型的材料的组合物。试样包括生物学试样,所述生物学试样是指从如下的活体来源获得的任何材料例如,动物如人类或其他哺乳动物、植物、细菌、真菌、原生生物或病毒或加工形式如扩增或分离的材料。感兴趣的一个或多个基因座可表示决定特定性质,如致病性程度、耐抗生素性等的基因或DNA或RNA序列的特定位置。待基因型分型的基因座的数量,N,优选I至10000之间,更优选I至100之间,最优选I。
预扩增的量级可足以通过例如凝胶电泳或实时PCR的方法直接检测,但也可低于直接检测典型所需的量。在步骤b)中,利用引物依赖性酶促反应使来自步骤a)的所述扩增子进行二级核酸扩增反应,步骤b)包括以下两个步骤bl)和b2)。第一级,步骤bl)为利用与步骤a)中所产生的各扩增子结合的第二批引物对的核酸扩增。所述第二批引物对,由第二组的一个或多个不同的正向引物和第二组的一个或多个不同的反向引物所组成,其中来自所述第二组引物的至少一个引物、形成选择引物组的所述至少一个引物靶向各基因座的各序列变体。与常规引物设计不同,对于结合靶标的选择引物,应选择具有其中基因型之间的差异可清晰地呈现的大的变异区域。所述选择引物是二分的,在3’端具有与所述基因型标记物区的N个基因座之一结合的基因座识别序列部和在5’端具有基因型特异的人工一片式标记序列部或其中一片为基因型特异、另一片为非基因型特异的人工两片式标记序列部。与基因型标记物区的靶基因座结合的所述选择引物各自与另一引物一起形成引物对,所述另一引物属于第二组引物但靶向可充当步骤a)的引物结合靶标的所述核苷酸序列。优选各选择引物以小于ΙΟΟηΜ、优选10-0. OlnM和最优选约O. InM的浓度存在,所述引物对的另一引物以所述选择引物的浓度的至少100倍、优选在100至100000倍之间的浓度存在。该步骤bl)产生各自含有各所述N个基因座之一的扩增子。二分选择引物与所述N个基因座任一的结合或靶向应在严格条件下通过所述引物与含有所述基因座的基因型标记物区的杂交而发生。基因型标记物区与选择引物之间的错配数应小于5、优选小于4、更优选不超过1,和最优选O。低浓度的选择引物允许非常高的多重性(至少10-1000)。可在所述方法中同时使用大量不同的选择引物,例如10000种引物、更优选1000至100种引物。正是由于用于基因型分型的方法的非常强有力的特征,如果需要,可用于同步扩增的不同选择引物的总数可易于增加,例如,由于导致不能预先已知的序列的突变而需要新的检测用引物。选择引物还可为简并的,允许借助相同引物的变体在相同基因型中检测非常类似的序列。简并引物的概念是本领域熟知的。在简并寡核苷酸(引物)的核酸序列中,R为A或G,Y为C或T,M为A或C,K为G或T,W为A或T,S为C或G,B为C、G或T,D为A、G或 T,H 为 A、C 或 T,V 为 A、C 或 G,N 为 A、C、G 或 T。所述其他引物的浓度为所述选择引物的至少100倍,并可在100至O. 01 μ Μ、优选10至O. 01 μ M的范围内,并最优选约O. 3 μ Μ。第二级,步骤b2)为利用与步骤bl)中产生的各扩增子结合的第三批引物对的核酸扩增。该批引物对,以步骤bl)中的所述选择引物的浓度的至少100倍、优选在100至100000倍之间的浓度存在,由第三组的一个或多个不同正向引物和第三组的一个或多个不同反向引物组成。来自所述第三组引物的至少一个引物靶向各选择引物的各标记序列部,其中所述至少一个引物形成检测引物组,并且其中与所述标记序列部结合的所述检测引物各自与另一引物一起形成引物对,所述另一引物属于所述第三组引物但靶向可充当步骤a)的引物结合靶标的所述核苷酸序列。所述检测引物优选具有i)对应于所述选择引物的所述人工一片式标记序列部的基因型特异性序列,其中各检测引物用基因型特异性可检测标签来标记;或ii)全部检测引物所共有的并且对应于所述选择引物的所述人工两片式标记序列部非特异性序列的非基因型特异性序列,其中各检测引物可选地在5’端用可检测标签或化学部分标记。步骤b2)产生各自含有用基因型特异性标记序列和可选地基因型特异性标签标 记的所述N个基因座之一的可检测扩增子。所述检测引物可用选自由荧光基团、发光标签、放射性标签、酶标签、生色团,例如Biosearch Blue ,吖唆、香豆素、FAM、若丹明绿、TET 卡尔萤石(Cal F luorf 金 540、J0E、VIC、HEX、卡尔萤石橙 560、Quasar 570、TAMRA、若丹明红、卡尔萤石 590、Cy3. 5、R0X、卡尔萤石红610、卡尔萤石红635、Pulsar (R) 650>Quasar 670和Quasar 705,以及结合对的一个成员,例如生物素和链霉亲和素组成的组的标签来标记。属于所述第三批引物对的引物的浓度在100至O. 01 μ M、优选10至O. 01 μ M和最优选约O. 3μ M的范围内。在步骤c)中,通过以下进行所述靶核酸分子的所述N个基因座的基因型分型Cl)在其扩增期间或可选地之后,检测在步骤b2i)中所产生的各扩增子中所包括的各标签,并将主要量的检测标签与各基因座的特异基因型相关联;或c2)在扩增后使步骤b2ii)中产生的各扩增子与基因型特异性序列的检测阵列相接触,检测各扩增子与阵列的杂交,并将检测的杂交与各基因座的特异性基因型相关联。步骤Cl)的基因型分型可借助实时PCR而有利地进行,但对技术人员显而易见的其他扩增技术也是可想得到的。步骤c2)的基因型分型可借助检测阵列如微阵列分析而有利地进行,但对技术人员已知的其他技术也可使用。一种进行步骤Cl)的基因型分型的方法是通过使用邻近5’端的标签具有iso-dC核苷酸的检测引物。在dabcyl-iso-dGTP的存在下进行扩增,当将所述dabcyl-iso_dGTP引入iso-dC对侧时所述dabcyl-iso-dGTP使标签信号粹灭时,发生步骤cl)的检测。如果待基因型分型的一个或多个基因座对应于两个基因型,可计算标签信号之间的差异,以便实现更稳固的分析。通过监控来自标记的引物的差异信号或信号比,简单的阳性或阴性检测方案允许快速和简便的分型。用于扩增的适合的条件在本领域是熟知的,并且依赖于例如退火温度和时间、缓冲液的类型、添加剂、引物浓度、循环数等,并且为本领域技术人员所熟知。根据用于基因型分型的方法的扩增优选严格条件。选择引物和检测引物可具有筛选为使引物-引物相互作用最小化的序列。这可例如通过部分自身互补引物来实现。有利地,所述选择引物的人工标记序列部具有自身互补末端以形成小于10个碱基对、优选3-7个碱基对和最优选5个碱基对。一种使引物-引物相互作用最小化的方法为通过形成锅柄式结构,参见图4。优选将用于上述方法的全部引物构建成具有彼此相差约10°C、优选5°C和更优选I °c范围内的解链温度。在所述用于基因型分型的方法的一个实施方案中,可充当步骤a)的引物结合靶标的至少一个序列对应于借助所述第三组引物在步骤a)中形成的扩增子中引入的人工序列标记部,其中所述引物为二分的,并包括人工5’标记序列和结合到靶核酸分子的3’区。在另一实施方案中,所述可充当步骤a)的引物结合靶标的至少一个序列对应于基因组区。在一个优选的实施方案中,用于步骤b2)中的与可充当步骤a)的引物结合靶标的至少一个序列结合的所述第三组引物与用于步骤bl)的与可充当步骤a)的引物结合靶标的至少一个序列结合的所述第二组引物相同。在另一优选实施方案中,用于步骤bl)的与 可充当步骤a)的引物结合靶标的至少一个序列结合的所述第二组引物与用于步骤a)的第一组引物之一相同。选择引物和检测引物可属于所述正向引物组或属于所述反向引物组。所述N个基因座的各基因座对应于两个或多个基因型,优选两个基因型。这些两个基因型可分别表示其基因组包含所述基因座的微生物的高和低致病性。这两个基因型还可对应于基因座的存在与否,分别表示例如微生物的抗菌性(antimicrobial resistance)与非抗性。基因座的存在与否可例如表示对抗生素的抗性。所述微生物可为病毒,例如流感病毒、细菌等。步骤a)、bl)和b2)可在相同的反应管中进行、可在单独的反应管中进行,或者步骤a)、bl)和b2)任一在单独的反应管中,而另两个步骤在相同的反应管中进行。当在相同反应管中进行两步时可使用多室管(multicompartment tube),例如W02006066245 (A2)中所记载的。图2和3示出步骤b)的实施方案,其中具有人工两片式标记序列的二分选择引物例举于图2,具有人工一片式标记序列的二分选择引物例举于图3。在基因型分型一个具体基因座的方法的一个实施方案中,基因型分型了禽流感病毒中的裂解位点。所述裂解位点将在裂解时分别给予病毒以高致病性和低致病性。因此,高和低致病性对应于两个基因型。将一个引物对用于步骤a),所述引物对由包括SEQ ID NO:59和58的核酸序列的引物或包括SEQ ID NO :57和56的核酸序列的引物组成。步骤bl)的选择引物选自包括SEQ ID NO :1至55的的序列的寡核苷酸,而检测引物包括SEQ ID NO60和61的序列。在其优选的实施方案中,所述检测引物具有邻近5’端标签的iso-dC核苷酸,并在dabcyl-iso-dGTP的存在下进行步骤b2)的扩增,其中当将所述dabcyl-iso-dGTP引入iso-dC对侧时所述dabcyl-iso-dGTP使标签信号粹灭。考虑到世界范围内由高致病性流感病毒造成的严重的流行病威胁,本发明的方法例举为禽流感致病型分型分析,其中使试样询问基因组序列的两个大组中的几乎400个不同的裂解位点。然而所述方法在发生类似问题的基因组研究的全部领域中也应是有用的。已对东半球迄今为至所分离的全部禽流感病毒构建了禽流感致病型分型分析。该方法依赖于半巢式PCR的以下构建,即,在AIV致病型分型分析的情况下,允许试样的几乎400重(400-plex)询问,其覆盖根据我们的知识迄今已在东半球产生的全部相关序列变体。高水平的多重性仅在识别事件期间有效,并通过使用荧光团锅柄式引物简化为双色实时PCR检测。已显示所述方法提供快速且简便的替代DNA测序的方法,其可用于大型试样筛选或用于诊断领域的便携式PCR仪。高或低致病性病毒所特有的裂解位点的发生分别由阳性或阴性荧光信号比来表示。已显示该分析概念是可扩展的、通用的、稳健的和高度有效的。蛋白水解的翻译后裂解是病毒激活的普遍要求,并经常与致病性相关联。因此,分析技术还应发现在基础病毒研究中广泛的应用和诊断应用以及一般地在全部基因组领域中的分型应用。禽流感病毒致病型分型相当于区别所有产生氨基酸基序R/K-X-R/K-R的RNA序列与所有其他可能的核苷酸序列的问题。考虑到超过18,000个核酸序列可产生该系列的 氨基酸,这是一项艰难的探索性课题。出于这样的原因,AIV致病型分型典型地通过DNA测序而不是以基于探针的分析来进行7。在2009年早期,从除美洲的所有地理位置中,已发现H5和H7亚型的分离株含有约240个独特的裂解位点序列21,这由它们在NCBI数据库中的存在而证实。然而,由于可藏匿(harbor)流感病毒的广谱宿主的免疫学压力,使该数目稳定地增长,导致暴露的糖蛋白,尤其是决定致病性的血凝素蛋白质在表面改变。为了解决该问题,我们开发了通过在二级PCR系统的构建中将识别和检测事件分离的用于高度多重的试样DNA序列询问的新策略。通过将序列识别引物(选择引物)的浓度降低上千倍,我们能够设计识别现存裂解位点的全部组的380重引物混合物(过采样(oversampling)是由于产生目前自然界还未发现的某些序列的简并引物的使用)。通过预扩增靶标和有效地逆转识别事件能够使选择引物的浓度降低。将检测与裂解位点的致病性经含有不同荧光标签和序列的两个Plexor 引物17相关联,所述引物靶向两个组的二分选择引物(其反过来靶向低和高致病性裂解位点)的人工5’区。通过使用二重实时PCR形式,致病型分型反应可在单一管中进行,我们使两组裂解位点识别引物(选择引物)与靶标(即,裂解位点)竞争结合。在该方式下,我们避免了分析所需的绝对特异性,对于推论出致病性,待研究的试样的裂解位点更类似于两组选择引物中的一个或另一个是充分的。我们发现监控从两个检测引物获得的信号比(ratio signal)是方便的,从而相对于其它确定优选扩增选择引物组之一。此外,通过给予检测引物自身互补末端(锅柄式引物),大大降低了假性引发和非特异性信号。此处的机制不同于之前研究者的锅柄概念的用途,之前的研究者或者使用含通用5’端区域的嵌合引物来抑制引物二聚体9或者使用通用连接的衔接子序列来抑制靶标上的假性引发 ' 在本情况中,引物本身形成锅柄。将通过锅柄引物形成的强分子内和分子间碱基配对保护3’端并竞争出替换的可为NDA聚合酶提供底物的配对方式。此外,我们推测,二分选择引物的锅柄状5’端可充当排斥其他引物的电荷负荷(chargeload)从而降低引物之间的相互作用。由非结构DNA短片段组尝试构建检测引物22是不成功的,因为这些引物似乎易于在选择引物组中起始引发(数据未示出)。有趣的是,注意到在多重PCR中利用通用引物标签的首批研究之一还使用可形成含五个GC碱基对的发夹结构的通用引物23。本策略为禽流感病毒致病型分型提供显著有效和稳固的试验。所有携带有已占据(accounted for)选择引物组的裂解位点序列的分离株已被正确地致病型分型。仅当预扩增失败或当遇到新的裂解位点时,试验才失败。试验非常灵活,这是由于当含新裂解位点的病毒出现时可易于添加新的选择引物,并可使用任何预扩增引物,只要它们包括裂解位点即可。必须强调的是,致病型分型试验不是需要为适当灵敏度而完全优化的检测试验。这使得所述试验非常稳固且对所使用的确切的PCR温度谱以及引物的纯度和浓度不敏感。相反这些要求转移到预扩增系统。尽管选择引物约为普通引物的两倍长,并在本研究中使用一组55种简并选择引物,但是致病性试验的额外花费是可忽略的。这是由于与典型的引物浓度相比,由于上千倍的稀释,对于55种引物的整个组来说,其将每个反应的成本降低至单一常规引物的成本的10%。由于该试验依赖于半巢式形式,所以残留的污染物可成为问题。然而,具有识别引物的序列的浓度低三个数量级的致病型分型试验的固有不灵敏性使该试验比常规巢式PCR方法更不易于产生该问题。该致病型分型试验为禽流感的监控和诊断提供新的机会,这是由于其具有取代目前所使用的昂贵的、难处理的和耗时的测序方法的能力,和能够更快诊断的能力,优点是将样品简单转移到爆发附近的野外试验室。由于可用于区分致病型的简单的阳性/阴性信号的读出,即使在没有实时读取的情况下,该方法对在便携式PCR仪上的实施也是理想的。另一应用为通过多重询问感兴趣的序列的高通量筛选。尽管我们目前的研究中已例举了禽流感病毒致病型分型的试验策略,但蛋白水解的翻译后裂解是病毒激活的普遍需要,例如对于新城疫病毒和仙台病毒,裂解已与致病性相关联U。考虑到上述实力(strengths),认为 该技术将在基础和应用病毒学、在中央诊断研究所(central diagnostic institutes)以及简易野外试验室中发现广泛的应用。此外,该方法在基因组生物技术的所有领域中为广泛的一般分型应用提供新的方法。本发明的分型基因组序列的大组的方法的任何其他用途也是可以想到的,例如用于分别显示耐抗生素性和非抗性的细菌之间的区分。在本发明的第二方面中,涉及用于进行上述基因型分型方法的试剂盒,其包括用于进行该方法的预扩增步骤a)的由第一组的一个或多个不同正向引物和第一组的一个或多个不同反向引物所组成的第一批引物对、用于进行该方法的步骤bl)的第一级扩增的由第二组的一个或多个不同正向引物和第二组的一个或多个不同反向引物所组成的第二批引物对、第二组之一形成选择引物组,其中所述选择引物是二分的,具有3’端的基因座识别序列部和5’端的基因型特异的人工一片式标记序列部或其中一片为基因型特异而另一片为非基因型特异的人工两片式标记序列部;用于进行该方法的步骤b2)的第二级扩增的由第三组的一个或多个不同正向引物和第三组的一个或多个不同反向引物所组成的第三批引物对、第三组之一形成检测引物组,其中所述检测引物或者具有对应于所述选择引物的人工一片式标记序列部的基因型特异性序列或者具有各检测引物所共有并对应于所述选择引物的人工两片式标记序列部的非特定性序列的非基因型特异性序列,其中所述检测引物可选地在5’端用标签或化学部分标记;和可选地核酸扩增反应混合物的其他成分。所述选择和检测引物具有筛选为使引物-引物相互作用最小化的序列是有利的。这可通过提供具自身互补末端的引物来实现,所述末端形成小于10、更优选3-7和最优选5个碱基对。自身互补末端可如前面所述形成锅柄。检测引物优选用选自由荧光基团、发光标签、酶标签、放射性标签、生色团和结合对的一个成员(如生物素或链霉亲和素)组成的组中的标签或化学部分来标记。实例包括Biosearch Blue 、吖啶、香豆素、FAM、若丹明绿、TET卡尔萤石⑧金540、J0E、VIC、HEX、卡尔
萤石橙560、Quasark' 570、TAMRA、若丹明红、卡尔萤石590、Cy3. 5、R0X、卡尔萤石红610、卡尔萤石红 635、Pulsar (R) 650、Quasar 670 和 Quasar 705。在一个实施方案中,所述第三组正向引物与所述第二组正向引物相同,或所述第三组反向引物与所述第二组反向引物相同。在另一实施方案中,所述第二组正向引物与所述第一组正向引物相同,或所述第二组反向弓I物与所述第一组反向引物相同。在用于进行禽流感病毒的基因型分型的一个优选实施方案中,所述试剂盒包括包含SEQ ID NO :59和58的序列,或SEQ ID NO :57和56的序列的第一组引物、选自包括SEQID NO 1至55的序列的寡核苷酸的选择引物和选自包括SEQ ID NO 60和61的序列的寡核苷酸的检测引物。该试剂盒可包括包含邻近5’端标签的iso-dC核苷酸的检测引物,和然后核酸扩增反应混合物包括dabcyl-iso-dGTP。在本发明的第三方面涉及一种用于设计和生产选择引物的方法,该选择引物将用于基因型分型的方法或用于进行所述基因型分型方法的试剂盒中。该方法包括以下步骤a)至g)。步骤a)至e)优选借助一个或多个计算机程序进行。步骤a)中,比对大量的包括至少一个基因座的感兴趣的核酸分子序列。步骤b)中,借助具有序型(profile)比对功能的计算机程序合并比对的核酸分子序列。步骤c)中,将比对的核酸分子序列修整为具有覆盖所述基因座的20至50个核苷酸、优选30至40个核苷酸的寡核苷酸、更优选35个寡核苷酸,和步骤d)中调整步骤c)的所述寡核苷酸的长度,以使全部所述寡核苷酸实现相似的解链温度。所述寡核苷酸的解链温度在约10°C的间隔内、优选在5°C的间隔内、更优选在1°C的间隔内。步骤e)是指将所述寡核苷酸分成简并引物,步骤f)是指合成所述简并引物,同时将基因型特异的人工一片式标记序列部或其中一片为基因型特异、另一片为非基因型特异的人工两片式标记序列部添加到所述引物的5’端。最后,步骤g)中回收步骤f)的选择引物产物。所述选择引物的人工标记序列部可具有筛选为使引物-引物相互作用最小化的序列,例如通过自身互补形成小于10个、更优选3-7个和更优选5个碱基对。步骤a)的核酸分子序列优选源自微生物,例如病毒、细菌等。步骤a)的核酸分子序列可例如源自流感病毒,感兴趣的靶核酸序列可例如为血凝素前体蛋白裂解位点。根据本领域已知的标准,该裂解位点对应于表示高致病性和低致病性的两个基因型。在所述裂解位点裂解时赋予病毒以致病性。除染色体DNA以外,源自细菌种群的步骤a)的核酸分子序列可包括可动遗传因子如质粒、转座子、抗药基因盒和毒性基因,并且所述基因型分型将包括确定这些因子的存在和本质或者不存在这些因子,以及染色体基因座的基因型分型。在本发明的第四方面,涉及一种生产检测引物的方法,该检测引物用于基因型分型的方法或用于进行所述基因型分型方法的试剂盒中。该方法包括以下步骤合成具有如下序列的核酸分子,所述序列对应于所述选择引物的基因型特异的人工一片式标记序列部、或者对应于各检测引物所共有的且与所述选择引物的人工两片式标记序列部非特异性序列对应的非基因型特异性序列。可选地在5’端用选自由荧光基团、发光标签、酶标签、生色团、放射性标签和结合对的一个成员如生物素或链霉亲和素组成的组的标签或化学部分标记所述检测引物。实例包括Biosearch Blue 、吖啶、香豆素、FAM、若丹明绿、TET卡尔萤 石《金540、(^、¥1(、冊乂、卡尔萤石橙560、(^1^5&1^;570、141狀、若丹明红、卡尔萤石590、Cy3. 5、ROX、卡尔萤石红 610、卡尔萤石红 635、Pulsar (R) 650、Quasar 670 和 Quasar 705。在本发明的第五方面,涉及适合于靶核酸分子中基因座的基因型分型的选择引物,其中各基因座位于核酸分子的各基因型标记物区,并对应于两个或更多个基因型。所述选择引物包括3’端的基因座识别序列部和5’端的人工一片式基因型特异性标记序列部或其中一片为基因型特异的、而另一片为非基因型特异的人工两片式标记序列部。在一个实施方案中,将覆盖感兴趣的基因座的选择引物的部分具有15至50个核苷酸、优选15至30个核苷酸和更优选23个核苷酸的长度。优选选择引物产生约60°C的平均解链温度。在另一实施方案中,选择引物包括SEQ ID NO 1至55的序列。在本发明的第六方面,涉及一种用于设计选择引物的计算机程序产品。所述计算机程序产品包括可直接下载到计算机内存的计算机可读指令。这些可读指令适用于促使计算机设计根据本发明的选择引物。
以下实施例意于以任何方式、形状或形式,明确或含蓄地说明但不限制本发明。实施例I病毒RNA的提取。根据制造商的方法在Magnatrix 8000+自动提取仪(extractionrobot) (NorDiag AB, Hagersten, Sweden)中使用 MagAttract Virus Mini M48 试剂盒(Qiagen, Hilden, Germany),从除 EU Al PCR 检测样品(Proficiency Panel) 2008 以外的所有分尚株中提取病毒RNA。使用各病毒分尚株的100 μ I体积的试样,并在70 μ I含有0. 04%叠氮化钠的无RNase的水中洗脱,立即使用,否则在_70°C下保存直至使用。根据制造商的说明通过使用 QIAamp Viral RNA Mini 试剂盒(Qiagen, Hilden, Germany)提取 EU Al PCR检测样品2008。如所提取的RNA—样获得来自Freidrich-Loffler-Institute (fli)和Epizone Al RNA 样品 2009 的试样。反转录和预扩增。如EU参考试验室所推荐的,分别利用引物H5-kha-l/H5-kha_3和GK7. 3/GK7. 4进行提取的RNA的反转录和所有H5和H7试样的DNA预扩增7。两个PCR体系均以具有引物浓度为I μ M的使用Onestep RT-PCR试剂盒(Qiagen, Hilden, Germany)的25 μ I的反应体积进行,并添加2. 5 μ I提取的病毒RNA。H5-kha-l/H5-kha_3PCR体系的循环条件50°C下反转录30min ;96°C下酶激活/失活15min ;96°C IOsec、58 °C 30sec、68°C 30sec,40个循环;最终延伸步骤为68°C下7min。GK7. 3/GK7. 4的循环条件50°C下反转录 30min ;95°C下酶激活 / 失活 15min ;94°C 300sec、52°C 30sec、72°C 45sec,35 个循环;最终延伸步骤为72°C下4min 15sec。使用预制的含溴化乙锭(Invitrogen, Carlsbad, CA)的296E-凝胶通过琼脂糖凝胶电泳验证所有扩增,并在UV光下观察。对于H5和H7扩增物,期望的扩增子大小分别为300-320和200-220。除了除去用于原始研究中测序目的的反向引物的5’端突出序列(overhang sequence)之外,利用如前所述2°的设计为扩增所有AIV亚型的通用引物反转录并用一步反应预扩增部分(subset)试样。引物设计。2009年2月收集源自美洲以外的分离株并可在NCBI流感病毒资源中获得的所有H5和H7血凝素基因序列21,总计2305条序列。将序列分为四组H5N1 ;所有其他H5 ;H7N1+H7N3+H7N7 ;所有其他H7,使用默认设置分别与Muscle3. 624比对。由于H5N1序列的数量庞大,将这些序列分为两组,分别比对以降低存储器需要。然后将这两个比对组用Muscle的序型比对功能合并24。将比对结果修整为35-链节(mer),以HAO的裂解位点(R丨G)的甘氨酸密码子下游的四个碱基结尾,并使用Jalview 2 . 425除去冗余序列。基于这些序列设计引物。根据需要通过从35-链节除去3’和5’端碱基,同时尝试使引物覆盖R丨G密码子的至少一些核苷酸,手动调整引物以使其具有接近60°C的解链温度(当通过Rychlik等人的方法26计算时)。在大多数情况下实现了该目标。在这些调整后再次除去发生的冗余,最终保留235条序列。为了降低合成需要,将序列手动分成简并引物。简并度限制为32,并不进行简并引物浓度的调整。在引入简并度以后,由55条引物(SEQ ID NO1-55)造成序列总数增加到382条。靶向高(32个引物)和低(23个引物)致病基因型的裂解位点的引物分别携带 CGGGAACTATCACCAAACAACACCCCG 和 CGGGACAACAAACCACTATCAACCCCG的5’突出。在这些突出的各末端的四个末端GC碱基对在两条序列中是相同的,并且自身互补,同时通过一个是另一个的反向序列使剩余的内部部分不同。该批55个二分的、部分简并的引物构成选择引物组,其询问382个不同的裂解位点序列试样。用于检测高和低致病性裂解位点的PlexoP引物与对应的二分选择引物的突出部分具有相同的序列,但在 5’端分别用FAM和卡尔橙(CAL orange)-560标记。用于二级致病型分型试验的反向引物对于两个级别均是共有的,并且与预扩增体系所使用的反向引物相同。然而,尽管对于H5 (H5-kha-l/H5-kha-3)和H7 (GK7. 3/GK7. 4)预扩增体系是分开的,但在致病型分型试验中,反向引物共同添加到单一反应混合物中。实时PCR试验。所有选择引物浓度为O. 3nM,检测和反向引物浓度为O. 3 μ M。脱盐并将来自Sigma-Aldrich的以100 μ M溶于水中获得选择引物,并无需进一步纯化而使用。从Biosearch Technologies (Novato, CA)获得Plexor 弓丨物,从Promega (Madison, WI)获得Pl exor'K qPCR体系试剂。所有实时PCR试验在RotorGene3000仪器(CorbettResearch, Sydney, Australia)上进行。使用默认的FAM和JOE通道以从FAM和卡尔橙-560标记的引物分别激发和获取信号。使用RotorGene 3000标准软件分析工具,相对于原始FAM通道信号标准化原始JOE通道信号,并进行基线校正。通过95°C 10sec、50°C 15sec和72°C 20sec的30个循环实现扩增,随后是95°C下3min的初始维持时间。DNA 测序。在用 Big Dye Terminator v3. I 循环测序试剂盒(AppliedBiosystems, Foster City, CA)的循环测序中使用前,在37°C下用核酸外切酶/奸碱性磷酸酶(shrimp alkaline phosphatase)(ExoSAP-IT) (USB Corporation, Staufen, Germany)处理来自预扩增的PCR产物15分钟以降解残留的引物和核苷酸。反应体积为5 μ I,对于H5和Η7亚型试样分别含有7. 5pmol各引物H5-kha-l/H5-kha_3和GK7. 3/GK7. 4。循环条件为960C 15sec、50°C IOsec和60°C 2min的25个循环。通过使用Montage SEQ96测序反应纯化试剂盒(Sequencing Reaction Cleanup Kit) (MiIlipore Corporation, Billerica, MA)纯化产物,随后在 ABIPrism 3130x1 毛细管测序仪(Applied Biosystem, Foster City, CA)上分析。用DNAstar软件包(DNASTAR,Madison, WI)分析并编辑序列数据。结果为了实现试样的高度多重性询问从而检测分成两类的不同序列的目标,设计三级半巢式PCR试验的构思(图4)。试验显示四个显著的特征。首先,通过PCR预扩增包括待研究区域的较大的基因组区。因此,试验需要已知的保守引物区存在于待研究的序列片段位点之一。对于随后的实际致病型分型PCR试验,通过PCR使模板的量大幅增加,使引物浓度降低,由于引物间的相互作用被抑制,将允许高度多重性。事实上,在试验条件下,模板浓度可高于靶识别引物的浓度,并存在反向识别事件。与大多数PCR试验相反,通过设计使靶识别引物直接与感兴趣的区域结合,即,直接与裂解位点结合,“探查”结合区域的性质。然而,低浓度的靶识别引物阻止这些引物的扩增产物的直接检测。出于该原因,这些引物是二分的,含有独立于靶标的5’区,但具有依赖于引物的序列识别部分的性质的两种不同类型(在我们的情况中为高或低致病性裂解位点)。对应于靶识别二分引物的两个人工序列部的每一个的,即,共享相同的序列的,是与二分引物相反的额外的引物,该额外的引物是高浓度的并带有荧光标签。因此,本试验的第二个显著的特征为含有二分序列识别引物的二级PCR体系,其在识 别靶DNA时将被延伸,并以高浓度形成第二组的靶标独立的人工引物的靶标。由于靶标将选择延伸哪一组引物,我们将前者标注为选择引物,后者标注为检测引物。注意,所有三个PCR体系,预扩增体系和二级致病型分型体系,都利用相同的反向引物,并注意,与预扩增PCR —起,总计有三级PCR体系。为了降低自身相互作用和假性引发检测引物,因此给予选择引物的5’区“锅柄”结构。在引物中形成的大量二级结构构成本试验的第三个新特征,并由于可同时形成分子内和分子间结构因此与常规引物设计形成鲜明对t匕。然而,所有这些结构都用于保护3’端的目的,并在选择引物的情况下构成“电荷负荷”,该“电荷负荷”将排斥其他弓丨物并使引物自身相互作用最小化。最后,本试验的第四个典型性质涉及检测和分析扩增产物的方法。检测原理依赖于源自于选择引物的PCR产物组之一优于其他的扩增。这由用不同的荧光团(致病型分型试验中的FAM和卡尔橙-560)标记两个检测引物来评价,并实时测量差异或信号比。由于本试验不含有探针,所以将Plexoi· 突光引物技术用于检测17。与大多数实时PCR技术相反,在Plexor 技术中引物延伸时突光降低17。在AIV致病型分型试验中,来自低致病性的检测引物的信号除以来自高致病性的检测引物的信号。因此,含有显示高致病性的禽流感病毒的试样将产生阳性信号,而低致病性病毒将产生阴性信号。2009年2月,编辑了可在NCBI数据库中获得的来自东半球(更精确地说是除美洲以外的全世界)的所有特有裂解位点序列。发现分别检测高和低致病性裂解位点的31和22个简并选择引物可解释所述地理区域中所有已存在的裂解位点,所述地理区域已限制了研究。这组53个简并引物覆盖了总计380条序列。随后,添加两个额外的引物(参见以下)。所有引物被设计成,至少某种程度上,覆盖含3’端的R丨G密码子,并具有接近60°C的解链温度。调整的参数为引物的长度和相对于裂解位点的微量偏移。高和低致病性引物组的平均解链温度为 59. 7V (SD=L 7V ;N=152)和 60. 1°C (SD=L 9V ;N=230)。图 9 给出解链温度和弓I物长度的分布。选择和检测弓I物的浓度分别为O. 3nM和O. 3 μ Μ。为了使本研究设计的致病型分型策略可与目前EU中禽流感诊断用方法相比,将用于 Η5 和 Η7 AIV 检测和由 EU 中央参考试验室(central reference laboratories, CRL)测序的裂解位点7’18的引物用于预扩增。尽管用于检测H5和H7亚型的CRL PCR引物是不同的,但将单一混合液(mastermix)用于所有致病型分型反应,这是由于来自两个体系的反向引物是共添加的。所有研究的分离株的致病型已预先通过核酸测序而确定或在本研究中测序(表I)。图5中,分别用实线和虚线示出高和低致病性分离株的扩增曲线。从图5a中清楚地看到,利用本试验将所有23个H5分离株正确地致病型分型,而从图5b中可看出,19H7分离株中的两个被错误致病型分型为高致病性(A/绿头鸭/123455/08 (H7N7)和A/绿头鸭/100993/08 (H7N7))。然而,这些目前含新裂解位点的分离株并未包括在致病型分型试验的初始设计中。我们稍后将示出本试验策略的具体优势是简便和明确的可扩展性,从而解释含预先未见过的裂解位点的新分离株的出现。为了进一步挑战致病型分型试验,测试了用于2008的CRL分布成环试验(distributed ring trial)(图6)。从固定样本(panelsamples)中获得的所有致病型分型结果与裂解位点序列一致(表I和表2)。注意,病毒A/鸡/意大利/99(H7N1)以高和低致病性变体存在。这对应于该病毒由裂解位点区的突变的致病性转化19。禽流感病毒基因组是高度变异的,特别是表面暴露的基因,例如主要负责致病性的血凝素基因。出于该原因,确定致病性的方法能够以简便的方式解释新出现的病毒变体是很重要的。为了确定AIV的致病性,并不存在此类方法,而诊断实施也固定为DNA测序。图7示出,用初始选择引物组和包括解释2008H7N7分离株所携带的新裂解位点的 选择引物的延伸组扩增四个不同的分离株,包括图5中错误地致病型分型的A/绿头鸭/123455/08 (H7N7)和A/绿头鸭/100993/08 (H7N7)(带叉形记号的曲线)。可看出,两个H7N7分离株(灰色、标有箭头的曲线)选择性地受新引物的影响,从阳性信号(高致病性)转为阴性信号(低致病性),而其它两个分离株保持几乎未受所添加的引物的影响。因此,该试验可根据需要通过简单地添加新的选择引物而非常容易地扩增。致病型分型试验依赖于成功的预扩增。然而,目前已报道2°推荐的CRL引物7不能扩增例如A/鸭/亚伯达/48/76 (H7N3),我们观察到这些引物还不能扩增A/马/布拉格/1/56(H7N7)。由Gall及同事设计新引物(pan-HA)以提供随后通过测序来基因型分型的通用扩增2°。本试验构想的灵活性的进一步说明由图8提供,其中我们代替使用CRl引物,用pan-HA引物进行预扩增,然后,结果还使用pan-HA反向引物作为致病型分型反应中的反向引物,但在其他方面保持致病型分型试验的所有组分完整。参见图8,所有分离株都被正确致病型分型,包括A/鸭/亚伯达/48/76 (H7N3)和A/马/布拉格/1/56 (H7N7)分离株。来自A/鸭/亚伯达/48/76(H7N3)的信号看上去相当弱,这是由于选择引物间最近的匹配包含三处错配。由于A/鸭/亚伯达/48/76(H7N3)为北美洲分离株,该序列并不特异地适用于选择引物的设计。实施例2 :覆盖全世界所有分离株的延伸的AIV引物组病毒RNA的提取。从USA, Iowa, Ames的国家兽医服务试验室(NationalVeterinary Service Laboratory)提取获得病毒 RNA。反转录和预扩增。美国H5试样的提取的RNA的反转录和DNA预扩增分别利用正向引物prfH5WH和反向引物prrH5WH(表4)。在25 μ I的反应体积中进行PCR体系,各反应使用Onestep RT-PCR 试剂盒(Qiagen, Hilden, Germany),和 I μ M 浓度的引物并添加 2. 5 μ I 提取的病毒RNA。循环条件为50°C下反转录30min ;96°C下酶激活/失活15min ;96°C lOsec、58°C 30sec、68°C 30sec的40个循环;最终延伸步骤为68°C下7min。使用预制的含溴化乙锭(Invitrogen, Carlsbad, CA)的29 -凝胶通过琼脂糖凝胶电泳验证所有扩增,并在UV光下观察。期望的扩增子大小为300-320。引物设计。如上所述设计引物。延伸选择引物组以便还包括来自西半球的分离株的裂解位点(2009年12月末在ncbi数据库中发现的全世界的所有裂解位点)。在总计468个特有引物中简并选择引物的数量为80 (表3)。检测引物与初始引物组所使用的是相同的(参见上述),反向引物为prrH5EH、prrH5WH、prrH7EH和prrH7WH。(表4)实时PCR试验。所有选择引物浓度为0.3nM,检测和反向引物浓度为0.25 μ M。脱盐并将来自Sigma-Aldrich的以100 μ M溶于水中获得选择引物,并无需进一步纯化而使用。从Biosearch Technologies (Novato, CA)获得PlexOl.”引物,从Promega (Madison, WI)获得PI e X O I· K qPCR体系试剂。所有实时PCR试验在RotorGene6000仪器(CorbettResearch, Sydney, Australia)上进行。使用默认的FAM和JOE通道以分别从FAM和卡尔橙-560标记的引物激发并获取信号。使用RotorGene 3000标准软件分析工具,原始JOE通道信号除以相对应的原始FAM通道信号,并通过从所有荧光差异值中减去初始五个PCR循环的平均值来对所得信号进行基线校正。通过以下来实现扩增30个循环,95°C lOsec、52°C 15sec和72°C 20sec,随后是95。。下3min的初始维持时间。结果可从图10中看出,H7分离株(图10中的细线)未给出显著信号,并表现为阴性 对照(带叉形记号的细线)。高致病性美洲H5分离株(粗线;实线)和含有显示高致病性分离株的裂解位点的低致病性分离株(粗线;长虚线)给出阳性F(JOE)/F(FAM)信号,而低致病性美洲H5分离株给出阴性信号(粗线;短虚线)。实施例3 =NDV致病型分型RNA提取和预扩增根据制造商的说明用Magnatrix 8000+自动提取仪(Magnetic BiosolutionsSweden)通过使用 MagAttract Virus Mini M48 试剂盒(Qiagen, Hilden, Germany)从 NDV感染的胚卵的尿囊液中提取RNA。将RNA回收于70 μ I无核酸酶的水中,或者立即使用或者在-80°C下保存。使用NDV PlF和P2R测序引物(表7),将Onest印RT-PCR试剂盒(Qiagen, Hilden, Germany)用于所有NDV菌株的RNA转录和预扩增。在25 μ I的反应体积中进行RT-PCR,反应体积包含O. 6 μ M的各引物和2. 5 μ I提取的RNA。循环谱为60°C 30min ;95°C 15min ;40 个循环(94°C 20sec、60°C 15sec、72°C 15sec)和 72°C下最终延伸 lOmin。在用含溴化乙锭(Invitrogen, Carlsbad, CA)染色后通过2%琼脂糖凝胶电泳检测PCR产物,并在UV光下观察。期望的扩增子产物大小为362bp。引物设计通过使用计算机程序CLC主工作平台5 (CLC bio A/S, Aarhus, Denmark)从2010年3月的NDV融合基因(F)的核苷酸序列的NCBI搜索给出2757条序列的结果。由于NDV序列的数量庞大,根据NCBI Genbank的注册年代将它们分成5个组,通过CLC主工作平台5分别比对序列。序列的大小减少至30-链节,覆盖F基因的裂解位点,所述F基因包括Fl蛋白的N末端的117个残基,Fl蛋白是以苯丙氨酸(F)作为中等毒株和强毒株的毒性标志(RVF)和以亮氨酸(L)作为轻型毒株的低毒性标志(RVL)。通过使用JalvieW2.6. 251除去冗余序列,保留独特的裂解位点。其由68个引物决定(表6)。用于检测高和低致病性裂解位点的Plexor 引物与对应的二分选择引物的突出部分具有相同的序列,但在5’端分别用FAM和卡尔橙-560标记。用于二级致病型分型试验的反向引物与预扩增体系所使用的反向引物相同。实时PCR试验脱盐并以100 μ M(Sigma-Aldrich, Haverhill, UK)溶于水中来获得选择引物。所有选择引物浓度为O. 3nM,检测和反向引物浓度为0.3 μΜ。从BiosearchTechnologies (Novato, CA)获得 P]exor'H)引物,从 Promega(Madison, WI)获得Plexor qPCR体系试剂。所有实时PCR试验在RotorGene 3000仪器(CorbettResearch, Sydney, Australia)上进行。使用默认的FAM和JOE通道以分别从FAM和卡尔橙-560标记的引物激发并获取信号。在25 μ I的反应体积中,通过如下的30个循环实现扩增95°C 10sec、55°C 15sec和72°C 20sec,随后是95°C下3min的初始维持时间。DNA 测序由于许多已用于致病型分型的试样未鉴定,为此测序来自预扩增的PCR产物。使用 Bid Dye Terminator v3. I 循环测序试剂盒(Applied Biosystems, Foster City, CA) 反应体积为20 μ 1,含I. 8 μ I (2pmol)各引物、2 μ I大染料(big dye)混合物和2 μ I PCR产物。循环条件为96°C 15sec、50°C IOsec和60°C 2min,25个循环。通过使用MontageSEQ96测序反应纯化试剂盒(Millipore Corporation, Billerica, MA)纯化产物,随后在ABI Prism 3130x1 毛细管测序仪(Applied Biosystem, Foster City, CA)上分析。通过CLC 主工作平台5分析序列数据。结果在图11中,扩增曲线显示为用新城疫病毒(NDV)的致病型分型的PlexQI· 检测引物获得的两个通道(‘JOE’/’FAM’)中的荧光信号的标准化比值。中等毒株(长虚线)和强毒株(实线)被认为是高致病性,轻型毒株(短虚线)为低致病性。使用252个选择引物组进行图中表示的分离株的致病型分型的试验。预先在文献中已知25个分离株的致病性,对其他5个分离株(SD2C2、SA1C、LK2p、WARW和MX4)的裂解位点测序。构建试验以产生高致病性的阳性信号和低致病性的阴性信号。所有30个分离株均正确基因型分型。
权利要求
1.ー种将存在于试样中的靶核酸分子内的N个基因座基因型分型的方法,其中N至少为1,并且各基因座位于所述核酸分子的各自的基因型标记物区,并对应于两个或更多个基因型,所述方法包括以下步骤 a)利用引物依赖性酶促反应进行各基因型标记物区的预扩增,其中用由第一组的ー个或多个不同正向引物和第一组的ー个或多个不同反向引物所组成的第一批扩增引物对进行扩增,产生ー个或多个包括所述基因型标记物区的扩增子,并且其中各扩增子包含具有可充当不同于所述基因型标记物区的引物结合靶标的至少ー个核苷酸序列的区域; b)利用引物依赖性酶促反应使来自步骤a)的所述扩增子进行ニ级核酸扩增反应,其中 bl)第一级为利用与步骤a)中所产生的各扩增子结合的第二批引物对的核酸扩增,其中所述第二批引物对,由第二组的ー个或多个不同正向引物和第二组的ー个或多个不同反向引物所组成,其中来自所述第二组引物的至少ー个引物靶向各基因座的各序列变体,所述至少一个引物形成一组选择引物,所述选择引物是二分的,其具有3’端的与所述基因型标记物区的N个基因座任一个结合的基因座识别序列部和5’端的基因型特异的人工一片式标记序列部或其中一片为基因型特异的、另一片为非基因型特异的人工两片式标记序列部,并且其中与所述基因型标记物区的靶基因座结合的选择引物各自与另ー引物一起形成引物对,所述另ー引物属于所述第二组引物但靶向可充当步骤a)的引物结合靶标的所述核苷酸序列,并且其中所述选择引物各自以小于ΙΟΟηΜ、优选10-0. OlnM和最优选约O. 3nM的浓度存在,所述引物对的另一引物以所述选择引物的浓度的至少100倍、优选在100至100000倍之间的浓度存在,产生各自含有所述各N个基因座之ー的扩增子; b2)所述第二级为利用与步骤bl)中产生的各扩增子结合的第三批引物对的核酸扩增,其中所述第三批引物对,以步骤bl)中的所述选择引物的浓度的至少100倍、优选在100至100 000倍之间的浓度存在,所述第三批引物对由第三组的ー个或多个不同正向引物和第三组的ー个或多个不同反向引物组成,其中来自所述第三组引物的至少ー个引物靶向各选择引物的各标记序列部,所述至少一个引物形成一组检测引物,并且其中与所述标记序列部结合的所述检测引物各自与另ー引物一起形成引物对,所述另ー引物属于所述第三组引物但靶向可充当步骤a)的引物结合靶标的核苷酸序列,所述检测引物具有 i)对应于所述选择引物的所述人工一片式标记序列部的基因型特异性序列,其中各检测引物用基因型特异性可检测标签来标记;或 )全部检测引物所共有的并且对应于所述选择引物的所述人工两片式标记序列部非特异性序列的非基因型特异性序列,其中各检测引物可选地在5’端用可检测标签或化学部分标记; 其产生各自含有用基因型特异性标记序列和可选地基因型特异性标签标记的所述N个基因座之一的可检测扩增子; c)通过以下方式,基因型分型所述靶核酸分子的所述N个基因座 Cl)在其扩增期间或之后检测在步骤b2i)中所产生的各扩增子中所包括的各标签,并将检测标签的主要量与各基因座的特异性基因型相关联;或 c2)在扩增后使步骤b2ii)中产生的各扩增子与基因型特异性序列的检测阵列相接触,检测各扩增子与阵列的杂交,并将检测的杂交与各基因座的特异性基因型相关联。
2.根据权利要求I所述的方法,其中可充当引物结合靶标的所述核苷酸序列属于具有小于100个成员、优选小于20个成员和更优选I至5个成员的序列组。
3.根据权利要求I或2所述的方法,其中所述选择和检测引物具有筛选为使引物-引物相互作用最小化的序列。
4.根据权利要求3所述的方法,其中所述引物的所述人工标记序列部具有自身互补末端以形成小于10个碱基对、优选3至7个碱基对和最优选5个碱基对。
5.根据前述权利要求任一项所述的方法,其中在所述检测引物的5’端用选自荧光基团、发光标签、酶标签、放射性标签、生色团和特异性结合对的ー个成员的标签来标记所述检测引物。
6.根据前述权利要求任一项所述的方法,其中借助所述第一组引物,使可充当步骤a)的引物结合靶标的所述至少ー个序列对应于引入到在步骤a)中所形成的所述扩增子中的人工序列标记部,其中所述引物是二分的,并包括人工5’标记序列和结合所述靶核酸分子的3’区。
7.根据权利要求I至6任一项所述的方法,其中可充当步骤a)的引物结合靶标的所述至少ー个序列对应于ー个或多个基因组区。
8.根据前述权利要求任一项所述的方法,其中用于步骤b2)的与可充当步骤a)的引物结合靶标的所述至少ー个序列结合的所述第三组引物与用于步骤bl)的与可充当步骤a)的引物结合靶标的所述至少ー个序列结合的所述第二组引物相同。
9.根据前述权利要求任一项所述的方法,其中用于步骤bl)的与可充当步骤a)的引物结合靶标的所述至少ー个序列结合的所述第二组引物与用于步骤a)的任一第一组引物相同。
10.根据前述权利要求任一项所述的方法,其中N为I至100之间的整数。
11.根据前述权利要求任一项所述的方法,其中N为I。
12.根据前述权利要求任一项所述的方法,其中各基因座对应于两个基因型。
13.根据权利要求12所述的方法,其中所述各基因座的两个基因型分别表示基因组包含所述基因座的微生物的高和低致病性。
14.根据权利要求13所述的方法,其中所述微生物为流感病毒。
15.根据权利要求12所述的方法,其中所述两个基因型对应于基因座的有或无。
16.根据权利要求12或15所述的方法,其中所述特定基因座的有或无分别表示微生物的抗菌性与非抗性。
17.根据权利要求I至14任一项所述的方法,其中所述步骤a)的引物对由包括SEQIDNO 59和58的核酸序列的引物,或包括SEQ ID NO 57和56的核酸序列的引物,或包括表·7的核酸序列或选自表4的核酸序列的引物组成。
18.根据权利要求I至14和17任一项所述的方法,其中所述选择引物选自包括SEQIDNO :1至55的序列的寡核苷酸,或选自包括表3或表6的序列的寡核苷酸。
19.根据权利要求I至14和17至18任一项所述的方法,其中所述检测引物选自包括SEQ ID NO 60和61的序列的寡核苷酸。
20.根据前述权利要求任一项所述的方法,其中所述检测引物具有邻近5’端标签的iso-dC核苷酸,并在dabcyl-iso-dGTP的存在下进行扩增,其中当将所述dabcyl-iso-dGTP引入iso-dC对侧时所述dabcyl-iso-dGTP使标签信号粹灭。
21.根据前述权利要求任一项所述的方法,其中步骤a)、bl)和b2)在如下任一种中进行相同的反应管,単独的反应管,或步骤a)、bl)和b2)之一在単独的反应管中,而另两个步骤在相同的反应管中。
22.根据权利要求21所述的方法,其中进行两个步骤的所述反应管为多室管。
23.ー种用于进行根据前述权利要求任一项所述的方法的试剂盒,其包括用于进行权利要求I所述的预扩增步骤a)的第一批引物对;用于进行权利要求I所述的步骤bl)的第一级扩增的第二批引物对;用于进行权利要求I所述的步骤b2)的第二级扩增的第三批引物对;和可选地核酸扩增反应混合物的其他成分; 所述第一批引物对由第一组的ー个或多个不同正向引物和第一组的ー个或多个不同反向引物组成;所述第ニ批弓I物对由第二组的ー个或多个不同正向引物和第二组的ー个或多个不同反向引物组成,第二组引物中的ー组形成选择引物组,其中所述选择引物是二分的,具有3’端的基因座识别序列部和5’端的基因型特异的人工一片式标记序列部或其中一片为基因型特异而另一片为非基因型特异的人工两片式标记序列部;所述第三批引物对由第三组的ー个或多个不同正向引物和第三组的ー个或多个不同反向引物组成,第三组引物中的ー组形成检测引物组,其中所述检测引物具有对应于所述选择引物的人工一片式标记序列部的基因型特异性序列或各检测引物所共有的对应于所述选择引物的人工两片式标记序列部非特异性序列的非基因型特异性序列,其中所述检测引物可选地在5’端用标签或化学部分标记。
24.根据权利要求23所述的试剂盒,其中所述选择和检测引物具有筛选为使引物-引物相互作用最小化的序列。
25.根据权利要求24所述的试剂盒,其中所述引物的末端为自身互补的,以形成小于.10个、更优选3-7个和最优选5个碱基对。
26.根据权利要求23至25任一项所述的试剂盒,其中用选自由荧光基团、发光标签、酶标签、放射性标签、生色团和特异性结合对的ー个成员组成的组中的标签来标记所述检测引物。
27.根据权利要求23至26任一项所述的试剂盒,其中所述第三组正向引物与所述第二组正向引物相同,或所述第三组反向弓I物与所述第二组反向引物相同。
28.根据权利要求23至27任一项所述的试剂盒,其中所述第二组正向引物与所述第一组正向引物相同,或所述第二组反向弓I物与所述第一组反向引物相同。
29.根据权利要求23至28任一项所述的试剂盒,其中所述第一组引物包括SEQID NO:.59和58的序列,或SEQ ID NO 57和56的序列,或为包括表7的核酸序列或选自表4的核酸序列的引物。
30.根据权利要求23至29任一项所述的试剂盒,其中所述选择引物选自包括SEQIDNO :1至55的序列的寡核苷酸,或选自包括表3或表6的序列的寡核苷酸。
31.根据权利要求23至30任一项所述的试剂盒,其中所述检测引物选自包括SEQIDNO 60和61的序列的寡核苷酸。
32.根据权利要求23至31任一项所述的试剂盒,其中所述检测引物包括邻近5’端标签的iso-dC核苷酸,并且所述核酸扩增反应混合物包括dabcyl-iso-dGTP。
33.一种用于设计和生产选择引物的方法,所述选择引物将用于根据权利要求I至22任一项所述的基因型分型方法或用于根据权利要求23至32任一项所述的试剂盒中,所述用于设计和生产选择引物的方法包括以下步骤 a)筛选其中在不同基因型之间序列尽可能不同的高可变区; b)比对大量的包括至少ー个基因座的感兴趣的核酸分子序列; c)借助具有序型比对功能的计算机程序合并所述比对的核酸分子序列; d)将所述比对的核酸分子序列修整为覆盖所述基因座的具有20至50个核苷酸的寡核苷酸、优选30至40个核苷酸的寡核苷酸、更优选35个寡核苷酸; e)在仍覆盖所述基因座的同时,调整步骤c)的所述寡核苷酸的长度,以使全部所述寡核苷酸实现相似的解链温度,所述解链温度在约10°C的间隔内、优选在5°C的间隔内、更优选在1°C的间隔内; f)将所述寡核苷酸分成简并引物; g)合成所述简并引物,同时将基因型特异的人工一片式标记序列部或其中一片为基因型特异、另一片为非基因型特异的人工两片式标记序列部添加到所述引物的5’端; h)回收步骤f)的所述选择引物产物。
34.根据权利要求33所述的方法,其中所述人工标记序列部具有筛选为使引物-引物相互作用最小化的序列。
35.根据权利要求34所述的方法,其中所述引物的末端为自身互补的以形成小于10个、更优选3至7个和更优选5个碱基对。
36.根据权利要求33至35任一项所述的方法,其中步骤a)的所述核酸分子序列源自微生物。
37.根据权利要求33至36任一项所述的方法,其中步骤b)的所述核酸分子序列源自流感病毒,所述靶核酸序列是对应于血凝素前体蛋白裂解位点的靶核酸序列,所述两个基因型为构成在裂解时分别赋予所述流感病毒高致病性和低致病性的裂解位点的核酸序列。
38.根据权利要求33至37任一项所述的方法,其中步骤b)的所述核酸分子序列源自细菌种群,并且除染色体DNA以外包括可动遗传因子如质粒、转座子、耐药基因盒和毒性基因,并且所述基因型分型将包括确定这些因子的存在和本质或者不存在这些因子,以及染色体基因座的基因型分型。
39.一种生产检测引物的方法,所述检测引物将用于根据权利要求I至22任一项的所述基因型分型的方法或用于根据权利要求23至32任一项所述的试剂盒中,所述生产检测引物的方法包括以下步骤合成具有如下序列的核酸分子,和可选地用标签或化学部分在5’端标记所述检测引物,其中所述序列对应于所述选择引物的基因型特异的人工一片式标记序列部、或者对应于非基因型特异性序列,该非基因型特异性序列为各检测引物所共有且与所述选择引物的人工两片式标记序列部非特异性序列对应。
40.根据权利要求39所述的方法,其中所述检测引物用选自由荧光基团、发光标签、酶标签、生色团、放射性标签和特异性结合对的ー个成员组成的组的标签来标记。
41.适合于靶核酸分子内的基因座的基因型分型的选择引物,其中所述基因座各自位于核酸分子的各基因型标记物区,并对应于两个或更多个基因型,其中所述引物包括3’端的基因座识别序列部和5’端的人工一片式基因型特异性标记序列部或其中一片为基因型特异、而另一片为非基因型特异的人工两片式标记序列部。
42.根据权利要求41所述的引物,其中所述基因座识别序列部具有15至50个核苷酸、优选15至30个核苷酸和更优选23个核苷酸的长度。
43.根据权利要求41或42所述的引物,其选自包括SEQID NO 1至55的序列的寡核苷酸,或选自包括表3或表6的序列的寡核苷酸。
44.ー种包括可直接下载到计算机内存的计算机可读指令的计算机程序产品,其中所述计算机可读指令适用于促使所述计算机辅助进行根据权利要求33至40任一项所述的方法。
全文摘要
本发明的目的为提供一种解决区分大组基因组序列的问题的新方法。本发明涉及用于基因型分型存在于试样中的靶核酸分子内的N个基因座的方法,其中各基因座位于核酸分子的基因型标记物区,并对应两个或多个基因型。此外,本发明涉及用于进行所述基因型分型的方法的试剂盒。另外,本发明涉及用于设计和生产选择引物的方法,以及用于生产检测引物的方法,全部所述引物将被用于基因型分型的方法或进行基因型分型方法的试剂盒。本发明进一步涉及适合于靶核酸分子中基因座的基因型分型的选择引物和用于设计所述选择引物的计算机程序产品。
文档编号C12Q1/68GK102695806SQ201080060503
公开日2012年9月26日 申请日期2010年11月3日 优先权日2009年11月3日
发明者M·莱永, S·贝莱克 申请人:瑞典国家兽医研究所