本发明涉及生物医学技术领域,具体涉及一组与乳腺癌相关的突变基因及其辅助诊断试剂盒。
背景技术:
乳腺癌是一种全身性疾病、其发生和发展是一个涉及多因素、多环节的复杂过程,包括癌基因的激活以及抑癌基因的失活等。因此,基因突变在乳腺癌的发生、发展过程中起着非常重要的作用。
乳腺癌是一个多因素遗传变异性疾病,只有不足10%是由于单基因缺陷引起的。随着高通量基因技术的发展,越来越多与乳腺癌相关基因被发现,这些基因上潜在的遗传变异(单核苷酸多态和拷贝数变异)可能引起乳腺癌药物治疗效果的差异。由于遗传变异的存在使抗肿瘤药物的代谢途径以及药物作用的目标基因可能受到影响,进而影响疗效以及预后。
遗传性乳腺癌最常见的标志物为brca1和brca2基因的突变,但brca1/2基因突变检测乳腺癌以及治疗癌症通常是不够的,因为这些基因突变不发生在大量的偶发的癌症,只能用来解释一小部分遗传性乳腺癌的病因。
突变位点的存在被认为赋予个体不同表型性状,以及对环境暴露、药物治疗等的不同反应,因此突变位点可能是导致个体疾发生发展差异的重要遗传基础。将疾病易感的突变谱用于疾病的辅助诊断,具有广泛的应用前景。若能筛选出存在于偶发的癌症中的基因突变位点来诊断和预后乳腺癌,将对乳腺癌个体化治疗产生重要指导意义,并为其药物筛选及药效评价开辟新的途径。
技术实现要素:
本发明的目的是针对上述技术问题,提供一组与乳腺癌相关的突变基因及其辅助诊断试剂盒。
本发明的目的是通过下列技术方案实现的:
本发明首先提供了一组与乳腺癌相关的突变基因,所述突变基因包括naprt、lysmd4、cyp2f1和h6pd,所述突变基因携带的突变位点如表1所示。
表1四个乳腺癌相关基因突变位点信息
其中,naprt(nicotinatephosphoribosyltransferase,烟酸酯磷酸核糖转移酶)是蛋白编码基因,位于8号染色体。烟酸(na;烟酸)由烟酸磷酸核糖转移酶(naprt;ec2.4.2.11)转化为na单核苷酸(namn),然后转化为na腺嘌呤二核苷酸(naad),最后转化为烟酰胺腺嘌呤二核苷酸(nad),其用作细胞氧化还原反应中的辅酶,并且是细胞代谢中的各种过程的重要组成部分,包括对应激的应答;lysmd4(lysmdomaincontaining4,lysm结构域包含4)位于15号染色体,为蛋白编码基因;cyp2f1(cytochromep450family2subfamilyfmember1,细胞色素p450家族2亚型f成员1)基因编码的酶是细胞色素p450超家族成员,细胞色素p450蛋白是单加氧酶,其催化涉及药物代谢与胆固醇的合成,类固醇和其他脂质的许多反应。这种蛋白质位于内质网上,被称为3-甲基吲哚脱氢,衍生自色氨酸发酵的内源性毒素,以及诸如萘和乙氧基香豆素的异生底物;h6pd(hexose-6-phosphatedehydrogenase/glucose1-dehydrogenase,己糖-6-磷酸脱氢酶/葡萄糖1-脱氢酶)是蛋白质编码基因,位于1号染色体上,与h6pd相关的疾病包括可的松还原酶缺乏1和可的松还原酶缺乏引起的高雄激素过多。
优选的,所述的突变基因携带的突变为移码突变;所述移码突变是指dna片段中某一位点插入插入或丢失一个或几个(非3或3的倍数)碱基对时,造成插入或丢失位点以后的一系列编码顺序发生错位的一种突变。它可引起该位点以后的遗传信息都出现异常。发生了移码突变的基因在表达时可使组成多肽链的氨基酸序列发生改变,从而严重影响蛋白质或酶的结构与功能。
进一步地,本发明提供了一种用于检测乳腺癌相关基因突变的引物,所述乳腺癌相关的基因突变位点如表1所示;所述引物包括以下4组:
(1)naprt(nm_001286829)基因1号外显子组第34到47号位置上的碱基缺失的特异性引物:
正向引物:cgatactattagccccacccg(seqidno.1);
反向引物:ttccaccggccataggtgg(seqidno.2);
(2)lysmd4(nm_001284417)基因2号外显子组第207到208号位置上的插入碱基gacg的特异性引物:
正向引物:tctttaaacgaggcggtgga(seqidno.3);
反向引物:tacagcaggcctctcctgac(seqidno.4);
(3)cyp2f1(nm_000774)基因2号外显子组第15号位置上的碱基c重复一次的特异性引物:
正向引物:aaggtaagtcccaggggaga(seqidno.5);
反向引物:ccctcaatatggaaaaggccg(seqidno.6);
(4)h6pd(nm_001282587)基因2号外显子组第27到34号位置上的碱基缺失的特异性引物:
正向引物:gccgctttcctatgctcctg(seqidno.7);
反向引物:gatagtcctcggccgtcttc(seqidno.8)。
优选的,扩增上述基因突变位点的特异性引物是由上海生工设计合成,所述引物特异性强,扩增效果好。
进一步地,本发明还提供了一种乳腺癌辅助诊断试剂盒,所述试剂盒包括所述引物的一组或多组。
优选的,所述试剂盒还包括dna提取试剂、pcr试剂、阳性对照或阴性对照。
优选的,所述pcr试剂包括聚合酶、pcr反应缓冲液和ddh2o等。
上述pcr的反应体系为25μl:taqbuffer2.5μl,dna1μl,正向引物0.5μl,反向引物0.5μl,10mmdntp0.5μl,taq酶0.2μl,其余为ddh2o。pcr反应程序:95℃3min,35个循环(94℃30s,60℃30s,72℃1min),72℃10min。
本发明有益效果:
本发明利用naprt、lysmd4、cyp2f1和h6pd基因突变位点开发一种乳腺癌辅助诊断试剂盒,该试剂盒具有敏感性强,准确率高等优点,且方法简单、快速,对乳腺癌的早期筛查、预后评估具有重要的意义,也为基因治疗、药物治疗等临床应用提供了重要依据。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。
实施例1血液样本dna提取
1、材料
发明人于2015年1月至2016年12月在深圳市第二人民医院收集了大量的新发乳腺癌患者血标本,通过对样品资料的整理,发明人从中选择了25例符合下列标准的样本,同时选择10例年龄在25-55岁健康女性作对照进行全外显子芯片检测,样本选择标准如下:
(1)经病理学明确诊断的乳腺癌病例,其中有3例病人具有癌症家族史并分别标记为x1、x2、x3;
(2)采血前未接受过放疗或化疗、无既往肿瘤病史;
(3)与病例年龄匹配的健康女性对照并系统采集了这些样本的人口学资料和临床资料等情况。
2、提取dna
具体步骤为:
(1)向储存于2ml冻存管中的外周血加入溶血试剂(即裂解液,40份量配置方法如下:蔗糖219.72g、氯化镁2.02g和曲拉通x-100(amresco0694)20ml混合后,用trishcl溶液定容至2000ml,下同),颠倒混匀后完全转入。
(2)去除红细胞:用溶血试剂将5ml离心管补至4ml,颠倒混匀,4000rpm离心10分钟,弃上清。向沉淀中加入4ml溶血试剂,再次颠倒混匀清洗一次,4000rpm离心10分钟,弃上清。
(3)抽提dna:向沉淀中加1ml抽提液(每300ml中含有122.5ml0.2m氯化钠,14.4ml0.5m乙二胺四乙酸,15ml10%十二烷基硫酸钠,148.1ml双蒸水,下同)和8μl蛋白酶k,振荡器上充分振荡混匀,37℃水浴过夜。
(4)去除蛋白质:加1ml饱和酚充分混匀(手轻摇15分钟),4000rpm离心10分钟,取上清转入新的5ml离心管中。在上清液中加入等体积氯仿与异戊醇混合液(氯仿:异戊醇=24:1,v/v,下同),充分混匀后(手摇15分钟),4000rpm离心10分钟,取上清(分入两个1.5ml的离心管)。
(5)dna沉淀:在上清液中加入3m的醋酸钠60μl,再加入与上清液等体积的冰无水乙醇,上下轻摇,可见白色絮状沉淀物,再以12000rpm离心10min。
(6)dna洗涤:在沉淀中加入冰无水乙醇1ml,12000rpm离心10min,弃上清后真空抽干或置于清洁干燥环境中蒸干。
(7)测量浓度:通常能得到20-50ng/μldna,纯度(紫外2600d:2800d)在1.8-2.0。
实施例2高通量测序
1、文库构建
北京诺禾致源科技股份有限公司采用agilent的液相芯片捕获系统,对人的全外显子区域dna进行高效富集,然后在illuminahiseq平台上进行高通量、高深度测序。建库和捕获实验采用agilentsureselecthumanallexonv5试剂盒,严格使用说明书推荐的试剂和耗材,并参照最新的经过优化的实验流程进行操作。
实验基本流程:将基因组dna经covaris破碎仪随机打断成长度为180-280bp的片段,经末端修复和加a尾后在片段两端分别连接上接头制备dna文库。带有特异index的文库pooling后与多达543,872个生物素标记的探针进行液相杂交,再使用带链霉素的磁珠将20,965个基因的334,378个外显子捕获下来,经pcr线性扩增后进行文库质检,合格即可进行上机测序。
2、库检
文库构建完成后,先使用qubit2.0进行初步定量,稀释文库至1ng/μl,随后使用agilent2100对文库的insertsize进行检测,insertsize符合预期后,使用q-pcr方法对文库的有效浓度进行准确定量(文库有效浓度>2nm),以保证文库质量。
3、上机测序
库检合格,根据文库的有效浓度及数据产出需求进行illuminahiseq平台测序。
4、数据分析与处理
外显子组测序后获得原始数据,经过去污染等数据过滤、与人类参考基因组进行比对分析,检测个体携带的变异,包括snp(单核苷多态性)、indels(插入、缺失片段),并完成相应的注释和统计分析工作;保留位于编码区可能影响蛋白功能以及位于侧翼区可能影响转录本剪接的突变,包括无义突变、错义突变、移码突变、插入缺失以及剪切突变,将获得的突变与公共数据库dbsnp144、千人基因组计划1000genome、hapmap、yanhuangproject进行比对,滤除人群中的高频突变,筛除已知的snp及indel位点,所有的突变经过mutationtaster软件预测,筛选出新的致病性突变位点。
最终确定“乳腺癌病例”组和“健康女性对照”组中发现的基因型分布频率有显著差异的53个突变位点为优选敏感级位点;其中,naprt基因nm_001286829:exon1:c.34_47del:p.a12fs、lysmd4基因nm_001284417:exon2:c.207_208insgacg:p.d70fs、cyp2f1基因nm_000774:exon2:c.15dupc:p.s5fs和h6pd基因nm_001282587:exon2:c.27_34del:p.h9fs,上述突变经过上述生物信息学分析结果显示,所有突变均为移码突变,导致蛋白结构发生变化,为致病性突变。
实施例3sanger测序
分别针对naprt基因的1号外显子、lysmd4基因2号外显子、cyp2f1基因2号外显子和h6pd基因2号外显子设计引物,所用引物由上海生工设计合成,如表2所示。
所用pcr的反应体系(25μl体系)为:taqbuffer2.5μl,dna1μl,正向引物0.5μl,反向引物0.5μl,10mmdntp0.5μl,taq酶0.2μl,ddh2o19.8μl。pcr反应程序:95℃3min,35个循环(94℃30s,60℃30s,72℃1min),72℃10min。1%琼脂糖凝胶电泳检测,与紫外线切胶仪下切取pcr产物凝胶并纯化。对所有的pcr产物分别以正、反向引物序列测序,并对测序结果进行进一步分析,以上实验由上海生工完成。
表2引物序列
通过chromas序列分析软件,将测序结果与标准序列进行比对,并结合“健康女性对照”组序列,寻找突变位点。sanger测序结果显示:naprt基因nm_001286829:exon1第34到47号位置上碱基缺失;lysmd4基因nm_001284417:exon2第207到208号位置上的插入碱基gacg;cyp2f1基因nm_000774:exon2第15号位置上的碱基c重复;h6pd基因nm_001282587:exon2第27到34号位置上的碱基缺失,与全外外显子测序结果相符合。
从而进一步确认所述突变位点可用于乳腺癌的检测、治疗、诊断、预后评估等辅助诊断。
实施例4乳腺癌检测试剂盒组装
基于实施例3得到的引物组组装本发明所述的用于乳腺癌辅助诊断试剂盒,所述试剂盒包括实施例1中的dna提取试剂;还包含特异性扩增naprt、lysmd4、cyp2f1和/或h6pd基因引物的一组或多组如表2所示,所述试剂盒还包括相应pcr技术所需的常用试剂,如:dntps,mgcl2,双蒸水,taq酶等,这些常用试剂都是本领域技术人员熟知的,另外还可以有标准品和对照(如确定基因型的标准品和空白对照等)。此试剂盒的价值在于只需要外周血而不需要其他组织样品,通过最精简和特异的引物对检测snp,再通过snp基因型判断乳腺癌预后疗效,不仅稳定,检测方便,且精确,大大提高疾病诊断的敏感性和特异性,因此将此试剂盒投入实践,可以帮助指导诊断、预后和更有效的个体化治疗。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
序列表
<110>北京大学深圳医院(北京大学深圳临床医学院)
<120>一组与乳腺癌相关的突变基因及其辅助诊断试剂盒
<130>p16rxa95
<160>8
<170>patentinversion3.5
<210>1
<211>21
<212>dna
<213>人工序列
<400>1
cgatactattagccccacccg21
<210>2
<211>19
<212>dna
<213>人工序列
<400>2
ttccaccggccataggtgg19
<210>3
<211>20
<212>dna
<213>人工序列
<400>3
tctttaaacgaggcggtgga20
<210>4
<211>20
<212>dna
<213>人工序列
<400>4
tacagcaggcctctcctgac20
<210>5
<211>20
<212>dna
<213>人工序列
<400>5
aaggtaagtcccaggggaga20
<210>6
<211>21
<212>dna
<213>人工序列
<400>6
ccctcaatatggaaaaggccg21
<210>7
<211>20
<212>dna
<213>人工序列
<400>7
gccgctttcctatgctcctg20
<210>8
<211>20
<212>dna
<213>人工序列
<400>8
gatagtcctcggccgtcttc20