
本发明涉及遗传病基因检测领域,特别是涉及一种扩增pkd1基因的引物组及试剂盒。
背景技术:
:多囊肾(polycystickidney)又名potter(i)综合征、perlmann综合征,先天性肾囊肿瘤病、囊胞肾、双侧肾发育不全综合征等,是一种较常见的遗传性疾病。主要表现为两侧肾病变进展不对称,大小有差异,至晚期两肾可占满整个腹腔,肾表面布有很多囊肿,使肾形不规则,凹凸不平,最终导致终末期肾病。多囊肾按遗传方式可分为常染色体显性(成人型)多囊肾病(autosomaldominantpolycystickidneydisease,adpkd)和常染色体隐性(婴儿型)多囊肾病(autosomalrecessivepolycystickidneydisease,arpkd),其发病率分别为1/400~1/1000和1/10000~1/40000。adpkd以常染色体显性方式遗传。成人型多囊肾主要是由pkd1和pkd2基因突变致病,pkd1中基因突变致病率约85%,而pkd2中基因突变致病率约15%,则pkd1是成人型多囊肾的主要致病基因,pkd1基因编码的蛋白为多囊蛋白1(pc1)。pkd1基因位于16号染色体短臂上,基因长52kb,共有46个外显子,pkd1基因在16号染色体上存在6个与其同源的假基因,假基因与pkd1基因1-33号外显子序列同源性高达97.7%,大约80%的致病突变发生在此区域,常规的pcr或二代测序等方法难以特异性地将pkd1真基因靶向富集并检测,检测结果的准确性往往受到假基因的干扰。而且pkd1部分dna序列gc含量高,如1号外显子区域gc含量高达85%,利用pcr扩增或ngs等方法检测高gc含量的序列难度较高,很多利用pcr技术检测pkd1基因的试剂盒均只对第2-46号外显子进行扩增,无法检测1号外显子内的变异。pkd1无特定的突变位点,突变可能发生在任何部位,因此,全面地检测pkd1基因变异需要检测其所有外显子区域。现有的检测方法各有缺陷。比如,pkd1有46个外显子,分别扩增pkd1的每个外显子再进行一代测序,需要消耗较高的工作量和成本,并且难以特异性地扩增pkd1真基因,结果的准确性会受假基因序列的干扰;有文章中虽然无需分别扩增每个外显子但是扩增pkd1基因过程中所需要使用的引物组也过多,方法过于繁琐,检测效率低。或利用巢式pcr富集pkd1真基因,通常先用几段长片段pcr扩增pkd1基因,再以长片段pcr产物为模板,富集pkd1真基因,操作相对复杂;或利用二代测序方法检测pkd1,难以特异性地捕获pkd1真基因,并且二代测序读长较短,真假基因同源性高导致数据无法特异性地进行比对;或利用三代测序方法检测pkd1,成本相对较高。技术实现要素:鉴于以上所述现有技术的缺点,本发明的目的在于提供一种扩增pkd1基因的引物组及试剂盒,用于解决现有技术中的问题。为实现上述目的及其他相关目的,本发明提供的用于扩增pkd1基因的pcr引物组,其特征在于,所述pcr引物组包括以下引物对中的一对或几对:1)第一引物对:包括核苷酸序列如seqidno:1所示的上游引物与核苷酸序列如seqidno:2所示的下游引物;2)第二引物对:包括核苷酸序列如seqidno:3所示的上游引物与核苷酸序列seqidno:4所示的下游引物;3)第三引物对:包括核苷酸序列如seqidno:5所示的上游引物与核苷酸序列seqidno:6所示的下游引物;4)第四引物对:包括核苷酸序列如seqidno:7所示的上游引物和核苷酸序列如seqidno:8所示的下游引物。本发明的用于扩增pkd1基因的试剂盒包括第一引物对、第二引物对、第三引物对或第四引物对中的任一种或几种。本发明的用于扩增pkd1基因的扩增体系包括第一扩增体系、第二扩增体系、第三扩增体系和第四扩增体系,所述第一扩增体系包括所述第一引物对,第二扩增体系包括所述第二引物对,第三扩增体系包括所述第三引物对,第四扩增体系包括所述第四引物对。本发明的所述扩增pkd1基因的pcr引物组和/或所述扩增体系在制备检测pkd1基因变异产品中的用途。如上所述,本发明的扩增pkd1基因的引物组及试剂盒,具有以下有益效果:1)延长了覆盖1号外显子的扩增子长度,成功实现对极高gc含量的1号外显子区域的稳定扩增,扩增产物覆盖了pkd1全部外显子区域,及大部分内含子区域;2)一次性且特异性地获得pkd1基因序列,完全扩增不到pkd1的假基因序列;3)在完全排除假基因干扰的情况下,更加准确地检测pkd1基因的变异,包括已知变异和未知变异。附图说明图1为pkd1四个扩增子长片段pcr扩增产物电泳质检图,注:m为1kbextenddnaladder,片段长度由上而下依次为48.5kb,20kb,15kb,10kb,8kb,6kb,5kb,4kb,3kb,2kb,1.5kb,1kb,0.5kb;1号代表pkd1-f1/r1扩增产物,大小为14693bp、2号代表pkd1-f3/r3扩增产物,大小为13453bp、3号代表pkd1-f2/r2扩增产物,14394bp、4号代表pkd1-f4/r4扩增产物,大小3930bp。图2为pkd1四个扩增子对应文库质检图,m为2000bpmarker,片段长度由上而下依次为2000bp,1000bp,750bp,500bp,250bp,100bp,编号1、2、3、4分别对应扩增子1、2、3、4文库质检图。图3显示为1号扩增子中chr16:2148504位点上下游真基因与假基因的序列比对情况。图4显示为原始bam文件中,chr16:2148504位点(左起第一个框)由a突变为g,上游两个真假基因不一致的位点(分别用左起第二个框进而第三个框标注)并未发生突变。图5显示为chr16:2163303-2178540区域内真假基因比对图示。图6显示为chr16:2163303-2178540区域内的原始bam序列,方框标出的位置为假基因特异位点。图7显示为chr16:2177877-2186230区域内真假基因比对图示。图8显示为chr16:2177877-2186230区域内的原始bam序列,方框标出的位置为假基因特异位点。具体实施方式本发明提供用于扩增pkd1基因的pcr引物组,所述pcr引物组包括以下引物对中的一对或几对:1)第一引物对:包括核苷酸序列如seqidno:1所示的上游引物与核苷酸序列如seqidno:2所示的下游引物;2)第二引物对:包括核苷酸序列如seqidno:3所示的上游引物与核苷酸序列seqidno:4所示的下游引物;3)第三引物对:包括核苷酸序列如seqidno:5所示的上游引物与核苷酸序列seqidno:6所示的下游引物;4)第四引物对:包括核苷酸序列如seqidno:7所示的上游引物和核苷酸序列如seqidno:8所示的下游引物。其中,所述第一引物对扩增的区域中包括pkd1基因24-46号外显子。第二引物对扩增的区域中包括pkd1基因15-33号外显子。第三引物对扩增的区域中包括pkd1基因2-15号外显子。所述第四引物对扩增的区域中包括pkd1基因1号外显子。具体的,所述pkd1基因为人pkd1基因。所述pcr引物组为长片段pcr引物组。具体的,所述第一引物对扩增的碱基数为14693bp;所述第二引物对扩增的碱基数为14394bp;所述第三引物对扩增的碱基数为13453bp;所述第四引物对扩增的碱基数为3930bp。具体的,以hg19为基因参考序列:所述第一引物对覆盖的基因组区域为人第16号染色体中pkd1基因的2138216-2152908;所述第二引物对覆盖的基因组区域为人第16号染色体中pkd1基因的2147317-2161710;所述第三引物对覆盖的基因组区域为人第16号染色体中pkd1基因的2160176-2173628;所述第四引物对覆盖的基因组区域为人第16号染色体中pkd1基因的2184767-2188696。在一种实施方式中,所述pcr引物组包括第一引物对、第二引物对、第三引物对和第四引物对。所述pcr引物组可以用于扩增人pkd1全部外显子区域。对于上述例示的引物对具有的具体碱基序列而言,只要能够在pcr实施条件下特异性地识别各自的特异性识别区域(优选在单一的反应容器内使用的引物之间不发生退火及自退火),则可以使1个或多个碱基替换为其他碱基,也可在3’端或5’端添加1个或多个碱基。此处,所谓多个,例如为2~3个。向引物添加1个或多个碱基的情况下,优选向引物的5’端添加。将上述例示的引物对具体的碱基序列中的1个或多个碱基取代为其他碱基而得到的碱基序列、与被取代前的碱基序列(即,序列号所示碱基序列)的同一性优选为70%以上,更优选为75%以上,更优选为80%以上,更优选为85%以上,更优选为90%以上,更优选为95%以上。对于各引物的长度而言,只要能够特异性地识别对应的特异性识别区域、且引物之间不发生杂交即可,没有特别限制,优选为15个碱基以上且40个碱基以下。更优选的是,引物的长度的下限为16个碱基以上,进一步优选为17个碱基以上,进一步优选为18个碱基以上。更优选的是,引物的长度的上限为39个碱基以下,进一步优选为38个碱基以下,进一步优选为37个碱基以下。本发明还提供用于扩增pkd1基因的试剂盒,所述试剂盒包括第一引物对、第二引物对、第三引物对或第四引物对中的任一种或几种。在一种实施方式中,所述试剂盒包括第一引物对、第二引物对、第三引物对和第四引物对。在一种实施方式中,所述试剂盒还包括用于从样品中提取基因组dna的试剂;利用所述引物进行长片段pcr反应的试剂。在一种实施方式中,所述从样品中提取基因组dna的试剂可以采用现有的试剂盒。例如:天根血液抽提试剂盒。在一种实施方式中,利用所述引物进行长片段pcr反应的试剂包括dna聚合酶,pcr缓冲液,dntp混合物和水性介质。所述dna聚合酶为适合长片段pcr扩增的dna聚合酶。例如所述dna聚合酶可以是neb热启动taqdna聚合酶、takaralahotstartversion、takaragxldnapolymerase、sdpolymorase、toyobokod-plus-neo等。所述缓冲液通常可以向pcr体系提供最合适的酶催反应的条件。所述缓冲液只要起到上述作用即可。例如,所述缓冲液可以为2xpcrbufferforkodfxneo。所述dntp混合物通常作为dna合成中的原料,具体可以包括datp、dgtp、dttp、dctp等。所述水性介质通常可以用于调节pcr体系中各组分的浓度,通常可以作为稀释溶剂。在一种实施方式中,所述水性介质选自nuclease-freeddh2o。所述试剂盒中还可以包括其他各种核酸扩增所需要的试剂。例如,还可以包括扩增促进剂、镁离子。合适的扩增促进剂可以进一步改善非特异性扩增。例如,所述扩增促进剂可以选自甜菜碱、ssb、dmso等中的一种或多种的组合。再例如,所述扩增促进剂的浓度可以为0.5-2.5m、0.5-1m、1-1.5m、1.5-2m、或2-2.5m。所述镁离子通常可以作为pcr体系中的催化剂,其可以与dntp形成dntp-mg与核酸骨架相互作用、并能影响polymerase的活性。本发明还提供用于扩增pkd1基因的扩增体系,所述扩增体系包括第一扩增体系、第二扩增体系、第三扩增体系和第四扩增体系,所述第一扩增体系包括所述第一引物对,第二扩增体系包括第二引物对,第三扩增体系包括第三引物对,第四扩增体系包括第四引物对。所述第一扩增体系扩增的区域中包括pkd1基因24-46号外显子、所述第二扩增体系扩增的区域中包括pkd1基因15-33号外显子、所述第三扩增体系扩增的区域中包括pkd1基因2-15号外显子、所述第四扩增体系扩增的区域中包括pkd1基因1号外显子。在一种实施方式中,所述第四扩增体系包括dna模板、第四引物对、dna聚合酶、pcr缓冲液、dntp混合物和水性介质。所述dna模板优选使用人基因组dna。对于人基因组dna而言,可使用市售的dna提取试剂盒等,利用从被检体采集的血液或其他任意的组织而容易地获得。被检体没有特别限制,可优选地举出疑似多囊肾病发病的人、或者认为pkd1基因中遗传性地存在突变的可能性比较高的人。所述dna聚合酶为适合长片段pcr扩增的dna聚合酶。例如可以是neb热启动taqdna聚合酶、takaralahotstartversion、takaragxldnapolymerase、sdpolymorase、toyobokod-plus-neo等。在一种实施方式中,所述dna聚合酶为kodfxneodna聚合酶。在一种实施方式中,所述第四扩增体系包括下述成分:总量为50~150ng的dna模板、终浓度为150~300nm的第四引物对、酶活总量为0.5~2.5u的dna聚合酶、终浓度为400~500μm的dntp混合物。在一种实施方式中,所述第四扩增体系为25μl,包括下述成分:50ng/μldna模板1μl、10μm上游引物和下游引物总共0.375μl,2×kodbuffer12.5μl,2mmdntps5μl,1u/μlkodfxneo酶0.5μl。对于pcr循环条件而言,只要能够实现作为目标的pkd1基因的外显子的扩增即可,没有特别限制。例如,可将热变性的温度设定为92~100℃,优选为94~98℃。对于热变性时间而言,例如,可设定为5~180秒,优选为10~130秒。对于使引物杂交的退火温度而言,例如,可设定为60~80℃,优选为60~70℃。对于退火时间而言,可设定为例如10~60秒,优选为20~30秒。对于延伸反应的温度而言,例如,可设定为62~80℃,优选为64~78℃。对于延伸反应的温度而言,例如,可设定为4~15分钟,优选为7~15分钟。退火及延伸反应可在相同的条件下进行。将组合了热变性、退火及延伸反应的操作作为1个循环,可反复进行该循环,直至得到需要的量的扩增产物为止。例如,可将循环数设定为30~40次,优选为25~35次左右。本说明书中,“pcr循环条件”包括与pcr的热变性、退火、及延伸反应的温度及时间有关的条件以及循环数中的任一项、任意的组合、或全部。在一种实施方式中,第四扩增体系的pcr反应程序为:94℃热启动和预变性2min;98℃变性10s,60℃退火30s和68℃延伸15min,共27个循环;68℃最终延伸20min;4℃保存。所述第四扩增体系可以按照以上体系进行同比例扩大或缩小。在一种实施方式中,所述第一扩增体系包括第一引物对、dna模板、dna聚合酶、pcr缓冲液、dntp混合物和水性介质。在一种实施方式中,所述第二扩增体系包括第二引物对、dna模板、dna聚合酶、pcr缓冲液、dntp混合物和水性介质。在一种实施方式中,所述第三扩增体系包括第三引物对、dna模板、dna聚合酶、pcr缓冲液、dntp混合物和水性介质。所述第一扩增体系、第二扩增体系、第三扩增体系均包括下述成分:总量为50~200ng的dna模板、终浓度为150~300nm的第一、第二或第三引物对、酶活总量为0.5~2.5u的dna聚合酶、终浓度为400~500μm的dntp混合物。在一种实施方式中,所述第一扩增体系、第二扩增体系、第三扩增体系均为25μl,包括下述成分:10μm的引物对的上游引物和下游引物总共0.375μl,1u/μlkodfxneo酶0.5μl,2×kodbuffer12.5μl,2mmdntps5μl,50ng/μldna模板2μl。所述第一扩增体系、第二扩增体系、第三扩增体系可以按照以上体系进行同比例扩大或缩小。第一扩增体系、第二扩增体系、第三扩增体系的pcr反应程序为:94℃热启动和预变性2min;98℃变性10s,66℃退火30s和68℃延伸15min,共30个循环;68℃最终延伸20min;4℃保存。本发明还提供扩增pkd1基因的pcr引物组和/或扩增体系在制备检测pkd1基因变异产品中的用途。所述检测pkd1基因变异产品用于检测pkd1基因的变异、多囊肾发病原因的判断、治疗方案的选择、预后评估、和/或指导优生优育。对于未发病的人群,可以提示存在多囊肾发病风险,及早预防;对于已发病人群,有助于判断多囊肾发病原因,选择有效的治疗方案,同时可以指导优生优育,阻断pkd1致病变异在后代中的延续。本发明还提供体外检测pkd1基因突变的方法,所述方法包括以下步骤:1)配制所述用于扩增pkd1基因的扩增体系,进行pcr扩增;2)将pcr扩增产物依次进行文库构建、高通量测序;3)数据质控及分析:将测序得到的pkd1基因序列与pkd1假基因位点数据库比较;若数据中无假基因污染,继续进行pkd1真基因变异检测;若数据中有假基因污染,则证明扩增体系不合格,排查原因后重新扩增。在一种实施方式中,步骤1)中pcr反应后得到的产物经过琼脂糖凝胶电泳质检和/或磁珠纯化后再进行步骤2)。在一种实施方式中,步骤3)中构建假基因位点数据库的方法为:将测序得到的pkd1基因序列与其6个假基因序列进行比对,得到真假基因序列不一致的位点信息,利用这些位点信息构建pkd1假基因位点数据库。pkd1假基因位点数据库即是指真假基因序列不一致的位点的信息汇总。步骤3)中通过计算真假基因序列不一致的位点的假基因频率进行质控。所述位点的假基因频率是指该位点中假基因碱基占所有碱基覆盖深度的比例。进一步的,还通过计算假基因特异位点平均频率进行质控。假基因特异位点平均频率为该区域内检测到的所有假基因特异位点频率的平均值。步骤3)中,扩增体系不合格的可能原因有引物降解或污染、模板的质量和投入量、引物浓度、退火温度、延伸时间、扩增循环数不合格等。所述体外检测pkd1基因突变的方法包括用于非诊断目的和诊断目的的体外检测方法。所述非诊断目的的体外检测pkd1基因突变的方法包括用于研究多囊肾的疾病发生发展机制、构建疾病动物模型、筛选多囊肾预防或治疗药物。通过对pcr扩增产物的碱基序列进行分析,能够确定被检体的pkd1基因中是否存在突变(基因多态性)。碱基序列的分析可使用已知的测序技术实施。对于碱基序列分析的结果而言,在检测到基因多态性的情况下,可判断为该被检体的多囊肾病发病风险高。以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。在进一步描述本发明具体实施方式之前,应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围;在本发明说明书和权利要求书中,除非文中另外明确指出,单数形式“一个”、“一”和“这个”包括复数形式。当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义,本发明中使用的所有技术和科学术语与本
技术领域:
技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外,根据本
技术领域:
的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。实施例1长片段pcr扩增1.基因组dna提取采集人的外周血,使用天根血液抽提试剂盒全基因组gdna提取,并用nanodrop和qubit3.0仪测定dna浓度,记录好相应浓度及260/280和260/230的比值。2.长片段pcr扩增以上述抽提的全基因组gdna为模板,按照下表1中的引物对,表2、表3反应体系及表4、表5的扩增程序对pkd1全部基因扩增。表1中引物名称中f表示上游引物(正向引物),r表示下游引物(反向引物)。长片段pcr扩增使用的试剂盒是kfx-201(200u×1),本产品组成kodfxnoe(1.0u/μl)、2×pcrbufferforkodfxneo、2mmdntps,厂家:toyobo。表2中的反应体系1适用于pkd1-f1/r1、pkd1-f2/r2、pkd1-f3/r3片段扩增。表3中反应体系2适用于pkd1-f4/r4片段扩增。表1为引物列表表2反应体系1的组成表3反应体系2的组成pcr组分体积(μl)gdna(50ng/μl)12×kodbuffer12.52mmdntp(400μm)5上下游引物,10μm0.375kodfx0.5nuclease-freeddh2o5.625total25表4为反应体系1的长片段pcr扩增程序表5为反应体系2的长片段pcr扩增程序3.电泳质检长片段扩增完成后,取2μl的扩增产物,将6×loadingbuffer稀释成2×loadingbuffer加2μl,混匀进行0.5%琼脂糖凝胶电泳,观察扩增结果,结果如图1所示。实施例2文库构建1.长片段pcr产物纯化pcr产物使用翊圣或诺唯赞dna纯化磁珠1.0×样本体积纯化,80%乙醇洗涤两遍,30μlnuclease-freeddh2o洗脱,qubit染料法对其进行浓度测定。2.纯化后产物用翊圣建库试剂盒进行文库构建(1)dna片段化:分别取120ng已纯化pkd1四片段备用。用翊圣快速片段化/末端修复/a尾添加模块试剂,按照表6配制dna片段化反应体系,配制完成后进行表7的pcr反应程序。表6dna片段化反应体系试剂名称体积(μl)纯化产物dna(120ng)xsmearasemix10nuclease-freeddh2o(50-x)total60表7pcr反应程序(2)连接:用翊圣连接试剂按照表8配制连接体系后,按照表9的pcr反应程序进行连接。表8连接体系试剂名称体积(μl)dna60连接buffer20t4连接酶5长y接头(10μm)1.5nuclease-freeddh2o13.5total100表9pcr反应程序温度(℃)时间(min)20154hold(3)片段筛选:用翊圣dna纯化磁珠1.0×体积纯化,80%乙醇洗涤两遍,100μlnuclease-freeddh2o洗脱后,加70μl磁珠上清peg混匀,弃磁珠留全部上清加入新的已备20μl磁珠管中,弃上清留磁珠,80%乙醇洗涤两遍,23μlnuclease-freeddh2o洗脱。(4)扩增:将上述洗脱液按照表10配制pcr扩增体系,按照表11pcr反应程序进行扩增。表10扩增体系试剂名称体积(μl)2×kapahifimix25p5/p7(10μm)2dna23total50表11pcr反应程序(5)电泳质检:取2μl扩增产物,用2%琼脂糖凝胶电泳质检文库,观察结果,结果如图2所示。(6)扩增产物纯化:扩增产物用1.2×翊圣磁珠纯化,80%乙醇洗涤两遍,30μlnuclease-freeddh2o洗脱.。(7)定量:使用qubit3.0对文库进行定量,记录浓度信息。(8)qsep100质检:检测文库片段大小。3.测序使用illuminacn500二代测序平台对文库进行测序,测序完成后进行数据拆分。实施例3数据分析首先将pkd1基因的原始fastq文件(fastq文件:测序返回的数据,主要是序列信息和对应的质量值)进行过滤,去除质量差的数据,再与假基因位点库进行比对,检测每个扩增子文库分别在四个扩增子区域内的假基因特异位点,若检测到假基因特异位点,则计算该位点中假基因碱基占所有碱基覆盖深度的比例,称为该位点的假基因频率,并计算每个扩增子内所有假基因特异位点的假基因频率的平均值。假基因特异位点分析结果如表12所示为不同扩增子文库数据中的检测到的假基因特异位点信息。表12假基因特异位点分析结果如上表,1号扩增子文库数据检测到1个假基因特异位点,2号扩增子文库数据检测到4个假基因特异位点,3号扩增子文库数据检测到3个假基因特异位点,4号扩增子文库数据未检测到假基因特异位点。由于pkd1真基因中存在snp,某些snp位点突变后正好与假基因特异位点一致,导致数据中检测到假基因特异位点。长片段pcr将整段区域一次性扩增,若存在假基因污染,大部分假基因特异位点都应在数据中被检测到,不可能只检测到个别位点。具体看下这些位点上下游序列,若上下游序列中其他假基因特异位点没有被检测到,即可认为该位点并非假基因序列上的特异位点,而是该样本的真基因序列上发生了变异,变异后碱基正好与假基因特异位点碱基一致。这些假基因特异位点具体信息如表13:表13假基因特异位点具体信息以1号扩增子中chr16:2148504位点为例,该位点为snp位点(rs4018131),被收录在gnomad数据库中,且在东亚人群中突变型频率高达99.09%。具体看该位点上下游真基因与假基因的序列比对情况,如图3所示,第一条序列为pkd1基因序列,即真基因序列,下面六条序列依次为6个假基因序列。灰色标注的位点为chr16:2148504这个位点,框标注的位点为假基因特异位点。如图3,chr16:2148504这个位点与pkd1p2和pkd1p4两个假基因存在真假基因不一致的碱基,这个位点上游分别存在其他与pkd1p2和pkd1p4两个假基因不一致的碱基。数据中检测到该位点由a突变到g,且突变频率高达90%以上。若确实由于假基因污染导致,则其上游的两个假基因特异位点应该也会被检测到,且频率很高。但是数据中并未检测到这两个位点,如图4所示,原始bam文件[sam(sequencealignment/mapformat)文件的二进制压缩版本]中,可以看到chr16:2148504位点(左起第一个框标注)由a突变为g,而上游两个真假基因不一致的位点(分别左起第二个框和第三个框标注)并未发生突变。综上,可以证明,本专利的引物组及其反应体系,可以特异地扩增pkd1基因,假基因完全不被扩增到,从而在数据分析中,可以不受任何假基因的干扰,直接分析pkd1真基因中的变异。对比例1若扩增pkd1的引物序列没有经过特殊筛选设计,扩增后的pcr产物中会混合有假基因序列,严重干扰数据分析。如用pkd1-f5:gaatggtgtcagcctgggctctgtggaggactc和pkd1-r5:ttcatcagcatgctctggggcagacccctgcag这对普通引物去扩增pkd1基因的第2-12号外显子区域,扩增区域的基因组坐标为chr16:2163303-2178540,再将长片段扩增产物进行二代测序文库构建,最终数据中假基因污染比例较高,影响检测真基因变异的准确性。该普通引物扩增的扩增产物二代测序数据中假基因占比信息如表14。该区域内真假基因比对图示如图5,框中标灰的点为假基因特异位点。该区域测序数据原始bam序列如图6,方框标出的位置为假基因特异位点,根据颜色与上面比对图中的假基因特异位点一一对应。由此可见,数据中存在较高比例的假基因序列。表14普通引物扩增的扩增产物二代测序数据中假基因占比信息对比例2如用pkd1-f6:agagaagggacacagcagggatgagccagggag和pkd1-r6:gcttcccgcccacgcactttagcctgcag这对普通引物区扩增pkd1基因的第1号外显子区域,扩增区域的基因组坐标为chr16:2177877-2186230,再将长片段扩增产物进行二代测序文库构建,最终数据中假基因污染比例较高,影响检测真基因变异的准确性。该普通引物扩增的扩增产物二代测序数据中假基因占比信息如表15。该区域内真假基因比对图示如图7,框中标灰的点为假基因特异位点。该区域测序数据原始bam序列如图8,方框标出的位置为假基因特异位点,根据颜色与上面比对图中的假基因特异位点一一对应。由此可见,数据中存在较高比例的假基因序列。表15普通引物扩增的扩增产物二代测序数据中假基因占比信息以上的实施例是为了说明本发明公开的实施方案,并不能理解为对本发明的限制。此外,本文所列出的各种修改以及发明中方法的变化,在不脱离本发明的范围和精神的前提下对本领域内的技术人员来说是显而易见的。虽然已结合本发明的多种具体优选实施例对本发明进行了具体的描述,但应当理解,本发明不应仅限于这些具体实施例。事实上,各种如上所述的对本领域内的技术人员来说显而易见的修改来获取发明都应包括在本发明的范围内。序列表<110>上海韦翰斯生物医药科技有限公司<120>一种扩增pkd1基因的引物组及试剂盒<160>8<170>siposequencelisting1.0<210>1<211>23<212>dna<213>人工序列(artificialsequence)<400>1ctacgtccccagatggcctcaca23<210>2<211>21<212>dna<213>人工序列(artificialsequence)<400>2ccaatgagcacaactgctcgg21<210>3<211>22<212>dna<213>人工序列(artificialsequence)<400>3cacctgatgctgagaaggattt22<210>4<211>20<212>dna<213>人工序列(artificialsequence)<400>4cgcctgggggtgttctttac20<210>5<211>20<212>dna<213>人工序列(artificialsequence)<400>5gtaggagacgttggtgccat20<210>6<211>21<212>dna<213>人工序列(artificialsequence)<400>6gggcatcagacagcggcgatg21<210>7<211>20<212>dna<213>人工序列(artificialsequence)<400>7agcgtctccataaaggccac20<210>8<211>21<212>dna<213>人工序列(artificialsequence)<400>8ggtatcaatactggcacactt21当前第1页12