本发明涉及生物信息学
技术领域:
,具体而言,涉及一种检测微卫星位点不稳定性的方法及装置。
背景技术:
:人类基因组中都存在由均匀分布的2~6个核苷酸的串联重复片段构成的简单重复序列,即微卫星位点,部分结直肠癌病人的特定碱基重复序列会发生插入或缺失,这个现象与肿瘤的发生发展相关,但这一现象并不能作为疾病的诊断和患病风险判断的依据。现有技术中,该检测通常包括:从样本中提取dna,捕获肿瘤相关基因,进行高通量测序,并结合微卫星位点的序列信息对结直肠癌样本的微卫星位点稳定性进行检测。目前常用的微卫星位点稳定性检测方法是基于检测美国国家肿瘤研究所曾经通过的msi检测的统一检测标准:检测5个重复区域(微卫星位点)的不稳定情况来判定样本的微卫星位点稳定情况。然而,这种方法由于位点数较少的限制常常会存在假阳性和假阴性的情况发生。技术实现要素:本发明旨在提供一种检测微卫星位点不稳定性的方法及装置,以降低现有技术中微卫星位点稳定性检测中假阳性和假阴性的发生概率。为了实现上述目的,根据本发明的一个方面,提供了一种检测微卫星位点不稳定性的方法。该方法包括以下步骤:s1,样本处理:包括样本dna提取、打断、加接头、杂交捕获、洗脱、富集及测序;s2,数据处理:包括利用比对软件将测序序列比对到参考基因组上,得到比对文件,未比对上的序列形成软截断,然后根据比对的位置进行排序,并用samtools软件建立index;s3,检测微卫星位点不稳定性:包括:s31,确定待检测微卫星位点的区域;s32:对s31中确定待检测微卫星位点,确定比对文件中在相应位置的重复类型,对于各种重复类型,计算病理组织样本和对照样本每个位点每种重复类型各自所支持的reads条数;s33:对s32中的各种重复类型和位点进行过滤,使用曼惠特尼秩和检验判定每个位点在病理组织样本和对照样本中的差异情况,最后,使用有显著差异的位点覆盖率确定样本的微卫星不稳定情况。进一步地,s2中,利用bwa-mem比对软件将测序序列比对到参考基因上。进一步地,方法用于检测结直肠癌微卫星位点的不稳定性。确定待检测微卫星位点的区域包括:进一步地,样本dna包括病理组织样本dna和对照样本血液白细胞dna。根据本发明的另一个方面,提供了一种检测微卫星位点不稳定性的装置。该装置包括:样本处理单元:用于样本dna提取、打断、加接头、杂交捕获、洗脱、富集及测序;数据处理单元:用于利用比对软件将测序序列比对到参考基因组上,得到比对文件,未比对上的序列形成软截断,然后根据比对的位置进行排序,并用samtools软件建立index;微卫星位点不稳定性检测单元,包括:区域确定单元:用于确定待检测微卫星位点的区域;重复类型及数据处理单元:用于对区域确定单元中确定待检测微卫星位点,确定比对文件中在相应位置特定的重复类型,对于各种重复类型,计算病理组织样本和对照样本每个位点每种重复类型各自所支持的reads条数;不稳定性分析单元:对重复类型及数据处理单元中的各种重复类型和位点进行过滤,使用曼惠特尼秩和检验判定每个位点在病理组织样本和对照样本中的差异情况,最后,使用有显著差异的位点覆盖率确定样本的微卫星位点不稳定情况。进一步地,数据处理单元中,利用bwa-mem比对软件将测序序列比对到参考基因组上。进一步地,装置用于检测结直肠癌微卫星位点的不稳定性。区域确定单元确定待检测微卫星位点的区域包括:应用本发明的技术方案,结合目标区域捕获的高通量测序技术,可以极大地提高检测的位点数量,然后再判断病理样本和对照样本的差异,加上统计学检验,来确定样本的微卫星的稳定性,降低了现有技术中微卫星位点稳定性检测中假阳性和假阴性的发生概率。附图说明构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:图1示出了根据本发明一实施方式的检测微卫星位点不稳定性的方法的流程示意图。具体实施方式需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。根据本发明一种典型的实施方式,提供了一种检测微卫星位点不稳定性的方法。该方法包括以下步骤:s1,样本处理:包括样本dna提取、打断、加接头、杂交捕获、洗脱、富集及测序;s2,数据处理:包括利用比对软件将测序序列比对到参考基因组上,得到比对文件,未比对上的序列形成软截断,然后根据比对的位置进行排序,并用samtools软件建立index;s3,检测微卫星位点不稳定性:包括:s31,确定待检测微卫星位点的区域;s32:对s31中确定待检测微卫星位点,确定比对文件中在相应位置的重复类型,对于各种重复类型,计算病理组织样本和对照样本每个位点每种重复类型各自所支持的reads条数;s33:对s32中的各种重复类型和位点进行过滤,使用曼惠特尼秩和检验判定每个位点在病理组织样本和对照样本中的差异情况,最后,使用有显著差异的位点覆盖率确定样本的微卫星不稳定情况。应用本发明的技术方案,结合目标区域捕获的高通量测序技术,判断病理样本和对照样本的差异,加上统计学检验,来确定样本的微卫星的稳定性,降低了现有技术中微卫星位点稳定性检测中假阳性和假阴性的发生概率。上述方法中,步骤s31,确定待检测微卫星位点的区域,可以在整个检测微卫星位点不稳定性的方法实施前单独确认完成,以便提高后续操作效率。优选的,s2中,利用bwa-mem比对软件将测序序列比对到参考基因上,以便后续的标准化操作。根据本发明一种典型的实施方式,该方法用于检测结直肠癌微卫星位点的不稳定性。本发明的发明人筛选出了43个结直肠癌高度相关的微卫星位点,使用这些位点,判断病理样本和对照样本的差异,加上统计学检验,来确定样本的微卫星不稳定性,具有高灵敏性和高特异性的特点。43个结直肠癌高度相关的微卫星位点的区域包括:优选的,样本dna包括病理组织样本dna和对照样本血液白细胞dna。根据本发明一种典型的实施方式,结合目标区域捕获技术、高通量测序技术,结合确定的43个微卫星重复位点信息,提供了一套高特异性、高灵敏性的从dna中检测结直肠癌微卫星不稳定性的流程,如图1所示,主要步骤如下:包括检测程序外完成的部分和检测程序内完成的部分,其中检测程序外完成的部分包括:样本处理(图1中未显示,包括样本dna提取、打断、加接头、杂交捕获(使用特定序列的探针捕获常发生微卫星不稳定的基因)、洗脱、富集及测序)和对下机数据进行数据处理(包括利用比对软件将测序序列比对到参考基因上,得到比对文件,未比对上的序列形成软截断,然后根据比对的位置进行排序,并用samtools软件建立index);检测程序内完成的部分包括:分别确定病理组织和对照样本43个位点的重复类型,提取每种重复类型支持的序列条数,对给点的所有重复类型进行过滤,基于序列条数和曼惠特尼秩和检验确定每个位点的差异显著性,计算差异显著性位点占比,判断样本状态。根据本发明一种典型的实施方式,提供了一种检测微卫星位点不稳定性的装置。该装置包括:样本处理处理单元:用于样本dna提取、打断、加接头、杂交捕获、洗脱、富集及测序;数据处理单元:用于利用比对软件将测序序列比对到参考基因上,得到比对文本,未比对上的序列形成软截断,然后根据比对的位置进行排序,并用samtools软件建立index;微卫星位点不稳定性检测单元,包括:区域确定单元:用于确定待检测微卫星位点的区域;重复类型及数据处理单元:用于对区域确定单元中确定待检测微卫星位点,确定比对文件中在相应位置特定的重复类型,对于各种重复类型,计算病理组织样本和对照样本每个位点每种重复类型各自所支持的reads条数;不稳定性分析单元:对重复类型及数据处理单元中的各种重复类型和位点进行过滤,使用曼惠特尼秩和检验判定每个位点在病理组织样本和对照样本中的差异情况,最后,使用有显著差异的位点覆盖率确定样本的微卫星位点不稳定情况。应用本发明的技术方案,结合目标区域捕获的高通量测序技术,判断病理样本和对照样本的差异,加上统计学检验,来确定样本的微卫星的稳定性,降低了现有技术中微卫星位点稳定性检测中假阳性和假阴性的发生概率。优选的,数据处理单元中,利用bwa-mem比对软件将测序序列比对到参考基因上。根据本发明一种典型的实施方式,装置用于检测结直肠癌微卫星位点的不稳定性。优选的,区域确定单元确定待检测微卫星位点的区域包括:下面将结合实施例进一步说明本发明的有益效果,下列实施例中没有详细描述的部分均可采用现有技术的常规技术手段实现。实施例1在本实施例的第一部分中,待检的是已知微卫星位点稳定的结直肠癌病理样本及相应的对照样本。在本发明的实施例中,主要试剂用品是市售的,信息如下:本实施例中,操作步骤如下:1.提取dna(病理组织样本dna和对照样本血液白细胞dna),利用荧光定量计(qubit)进行定量,其浓度为3.8ng/ul,体积为130ul;利用超声破碎仪(covaris)对样品进行片段化,使dna片段大小在200-400bp之间,然后利用琼脂糖凝胶电泳检测片段大小是否符合要求。2.先将片段化的dna样品进行磁珠纯化,然后进行末端修复和3’端腺苷化,体系配置见表1,基本步骤如下:先在20℃温浴30min,然后在65℃温浴30min结束反应。表1末端修复和3’端腺苷化缓冲液7μl末端修复和3’端腺苷化酶混合液3μldna50ul(500ng)3.将上述修复后的dna进行接头连接,接头连接体系详见表2,在20℃温浴15min。表2试剂体积带标签的接头2.5μldna样品60ul连接反应液30ul连接酶10ul无核酸酶的水7.5ul4.将上述接头连接后的产物进行磁珠纯化,然后进行pcr扩增,得到足量的带接头的dna片段,基本步骤如下:先在98℃预变性45s,其次在98℃变性15s,然后在60℃退火30s,72℃延伸30s;重复变性退火延伸过程7次;最后在72℃延伸1min,结束反应。扩增体系见表3:表3试剂体积快速热启动聚合酶25μl扩增引物1ul连上接头的dna片段24μl5.对pcr扩增产物进行磁珠纯化后,利用qubit定量得到浓度后,取出500ng扩增产物,使用浓缩仪将扩增产物体积浓缩到4.4ul,然后进行封闭和探针杂交,杂交反应体系如下表4所示:表4试剂体积封闭试剂混合液5.6μlp5、p7封闭试剂2ul快速封闭试剂5ulrna酶封闭试剂2ul针对目标区域的生物素探针2ul杂交缓冲液6ul无核酸酶的水3ulpcr扩增产物4.4ul杂交反应条件如下表5所示:表56.使用链霉亲合素磁珠对探针结合的样品进行捕获,步骤如下:将50ul磁珠加入1.5ml离心管,置于磁力架上,弃上清,用200ul连接缓冲液清洗三遍后,使用200ul连接缓冲液重悬磁珠,将与探针杂交的样品加入磁珠,混匀仪上颠倒混匀30min,置于磁力架上,弃上清,用清洗液1清洗1遍,然后用预热到65℃的清洗液2清洗3遍,期间保证磁珠和缓冲液2的温度在65℃。最后置于磁力架上,弃上清,加入38ul无核酸酶的水,重悬磁珠。7.将磁珠捕获到的dna片段进行pcr扩增,扩增体系见下表6,得到足量的加上接头的dna片段,基本步骤如下:先在98℃预变性2min,其次在98℃变性30s,然后在60℃退火30s,72℃延伸1min;重复变性退火延伸过程14次;最后在72℃延伸5min,结束反应。表68.将得到的pcr扩增产物进行磁珠纯化,然后利用qpcr定量,利用2100进行片段大小检测。9.测序,在x-ten基因测序仪上完成测序,测序平台将得到的光信号转化为碱基序列下机数据为fq文件存储所有测序片段结果。在本实施例的第二部分中,将下机数据fq文件比对上参考基因组,去除低质量序列,使用检测流程进行检测,即分别确定病理组织和对照样本43个位点的重复类型,提取每种重复类型支持的序列条数,对给点的所有重复类型进行过滤,基于序列条数和曼惠特尼秩和检验确定每个位点的差异显著性,计算差异显著性位点占比,判断样本状态。样本检测结果如表7所示:表7目前设定阈值为0.2,该样本显著位点覆盖率为0.1,小于阈值,可以判定为微卫星状态稳定样本。另外,使用其他25例已知微卫星状态的结直肠癌样本按照实施例1的方法进行检测,所有样本均可正确检出。从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:与现有技术中使用五个微卫星位点进行检测的方法相比,本方法检测的位点更加全面(43个位点),可以很好地避免假阳性和假阴性的情况发生。除此之外,发展的检测流程可以很好地利用病理样本和对照样本的测序数据,辅之自行设计的统计学判断方法,使得检测的精度更高,效果更好。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页12