一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法与流程

文档序号:16980086发布日期:2019-02-26 19:26阅读:2682来源:国知局
一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法与流程

本发明属于基因组学数据分析领域,尤其涉及一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法。



背景技术:

实体肿瘤的组织样本中,绝大多数情况下都含有一些正常组织,这是在活检取样过程中一个经常遇到的问题。在癌症的临床基因检测中,就有必要知道其正常组织的含量。同时,正常组织的含量的多少也会影响对肿瘤的拷贝数(copynumbervariants,cnv)的计算。这是一个所有临床基因检测实验室需要解决的困难。

dna拷贝数的变化(cnv)是癌症的一个主要治病原因,因此成为基因检测的一个重要指标。cnv目前的常用检测平台和金标准是基因芯片(microarray)。随着dna二代测序(ngs)在基因组学领域的广泛应用,直接从ngs数据获得cnv结果已经逐渐在科研和临床检测中使用,并有最终取代基因芯片的势头。不论使用基因芯片还是ngs,cnv的计算都是来自于两种数据,log2ratio和b-allelefrequency(baf)。log2ratio用于计算cnv片段,baf则用于计算杂合体的缺失(lossofheterozygosity,loh)和等位基因的失衡(allelicimbalance)。



技术实现要素:

针对上述问题,本发明提供一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,用baf值推算出cnv重复和缺失区域的肿瘤组织或正常组织含量,并可同时获得肿瘤的cnv值。公式简单,该检测方法很容易在临床基因检测中使用,易于推广。

解决以上技术问题的本发明中的一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,其特征在于:包括以下步骤:

(1)获取baf值;根据基因芯片或ngs数据得到baf值;

(2)确定baf值的条件:cnv一个缺失片段的baf值,cnv重复片段的baf值;

(3)根据公式得到所需要正常组织含量和肿瘤拷贝数值:

a)当肿瘤组织有一个cnv缺失时(cnloss=1,而且假定缺失的是nb),

(其中,baf值采用两条代表杂合体的baf带的下端一条带(0<baf<0.5);c是肿瘤组织的含量(正常组织含量因此是1–c),na和nb分别是等位基因a和b的cnv值);

b)当肿瘤组织的cnv重复时(cngain>=1),

假定nb=1,只有na重复,这样下端的baf一条带(0<baf<0.5)就反映了na的变化。

定义:(totalcopynumber),

其中,nt为总拷贝数;

此时,

优化方案中,所述当cnv重复区域的nt出现多个可能值时,比较其对应的c值与cnv缺失区域的c值,同时参考其log2ratio值。

本发明提出一种精确简便的新算法解决这个难题,这将会对实体肿瘤的基因检测及科研带来积极的作用。本发明利用基因芯片或dna测序(ngs)数据中的b-allelefrequency(baf)值对肿瘤组织中正常组织含量和肿瘤拷贝数(cnv)进行简单方便的检测计算。另外,baf比log2ratio对变化更加敏感,这比单纯使用log2ratio的算法更有价值。

附图说明

下面结合附图及具体实施方式对本发明做更进一步详细说明:

图1为本发明中肿瘤cnv和baf的案例图

图2为本发明中肿瘤组织中不同正常组织含量对在cnv一个缺失时baf带分布的影响图

图3为本发明中用cnv缺失片段的baf值图

图4为本发明中cnv重复区域的nt出现多个可能值时结果图

具体实施方式

下面结合具体实施方式对本发明进行进一步说明:

实施例1

(1)获取baf值;根据基因芯片或ngs数据得到baf值;

(2)确定baf值的条件:cnv一个缺失片段的baf值,cnv重复片段的baf值;

(3)根据公式得到所需要值:

a)当肿瘤组织有一个cnv缺失时(cnloss=1,而且假定缺失的是nb),

(其中,baf值采用两条代表杂合体的baf带的下端一条带(0<baf<0.5);c是肿瘤组织的含量(正常组织含量因此是1–c),na和nb分别是等位基因a和b的cnv值);

b)当肿瘤组织的cnv重复时(cngain>=1),

假定nb=1,只有na重复,这样下端的baf一条带(0<baf<0.5)就反映了na的变化。

定义:(totalcopynumber),

其中,nt为总拷贝数;

此时,

实施例2

(1)获取baf值;根据基因芯片或ngs数据得到baf值;

(2)确定baf值的条件:cnv一个缺失片段的baf值,cnv重复片段的baf值;

(3)根据公式得到所需要值:

a)当肿瘤组织有一个cnv缺失时(cnloss=1,而且假定缺失的是nb),

(其中,baf值采用两条代表杂合体的baf带的下端一条带(0<baf<0.5);c是肿瘤组织的含量(正常组织含量因此是1–c),na和nb分别是等位基因a和b的cnv值);

b)当肿瘤组织的cnv重复时(cngain>=1),

假定nb=1,只有na重复,这样下端的baf一条带(0<baf<0.5)就反映了na的变化。

定义:(totalcopynumber),

其中,nt为总拷贝数;

此时,

所述当cnv重复区域的nt出现多个可能值时,比较其对应的c值与cnv缺失区域的c值,同时参考其log2ratio值。

试验一

如图1是一个肿瘤cnv和baf的案例。

图中上半部是log2ratio在22个常染色体及x和y染色体上的分布,其中每一个数据点反映探针的log2ratio值,由此计算出cnv片段值。log2ratio零值基线(log2ratio=0)代表cnv的正常值(cn=2),cnv值大于零的片段代表cnv重复(cngain),cnv值小于零的片段则代表cnv缺失(cnloss)。图中的高于或低于零值基线的阈值线分别决定cnv重复或缺失的数目。高于第一条cnv重复阈值线(从零值基线算起)cnv重复为1(cngain=1,总cn值为3),高于第二条cnv重复阈值线表示cnv重复为2或更多(cngain>=2,总cn值>=4);低于第一条cnv缺失阈值线(从零值基线算起)cnv缺失为1(cnloss=1,总cn值为1),低于第二条cnv缺失阈值线表示cnv缺失为2(cnloss=2,总cn值=0)。

图1中的下半部是baf在22个常染色体及x和y染色体上的分布,其中每一个数据点反映探针的baf值,由此显示出baf带(bafband),进而决定该区域是loh还是allelicimbalance。baf带是以0.5中线呈镜像对称分布。当cnv片段正常时(cn=2,log2ratio=0),相对的baf显示3条带(baf=0,0.5,1.0),如图中整个第2染色体;当cnv片段重复时,相对的baf显示4条带(上下两条带表示纯合,baf=0或1;中间两条带表示杂合),如图中整个第5染色体;当cnv片段缺失为1时(cnloss=1),相对的baf只有表示纯合的上下两条带,baf=0或1),如图中的x染色体;当cnv片段缺失为2时(cnloss=2),由于两个等位基因区域都缺失,探针的信号与背景信号相同,相对的baf就会呈现杂乱无章的分布,图中没有这种例子显示。

但是,当肿瘤组织中混有正常组织时,cnv重复和缺失相对的baf带的分布将会受到影响。显著的变化是cnv缺失也会让baf呈现4条带,而不是两条带,如图中的第3染色体。cnv重复虽然还是显示4条baf带,但baf带值将会与纯肿瘤组织的情形时不同,log2ratio值也会相对低一些。这使得对数据的分析变得复杂起来。然而,正是由于baf带型出现了不同的分布,也给计算正常组织在肿瘤组织中的含量和准确计算肿瘤的cnv值带来了希望。

试验二

图2中显示肿瘤组织中不同正常组织含量对在cnv一个缺失时baf带分布的影响。左边是纯正常组织,baf显示3条带,右边是纯肿瘤组织,baf显示2条带,中间三例分别显示10%,50%,75%的肿瘤组织(90%,50%,25%的正常组织)时的baf4条带的分布。由此可见,不同的正常组织含量实际上只影响代表杂合体的baf两个中间带,当肿瘤组织含量增加时(正常组织含量相应降低时),两条baf中间带的间距增大。

当肿瘤组织有一个cnv缺失时(cnloss=1,而且假定缺失的是nb),

(公式1)

注:baf值采用两条代表杂合体的baf带的下端一条带(0<baf<0.5)。

当肿瘤组织的cnv重复时(cngain>=1),

假定nb=1,只有na重复,这样下端的baf一条带(0<baf<0.5)就反映了na的变化。

定义:nt为总拷贝数(totalcopynumber)

(公式2),

此时:

(公式3)

将公式1,2,3用于实践,如图3中所示。

如图3显示,无论用cnv缺失片段的baf值(baf=0.33)而使用公式1或用cnv重复片段的baf值(baf=0.40)而使用公式2,该案例都得到肿瘤组织的含量为0.5或50%。

从公式2或3可以看出,当处理cnv重复(cngain)时,c与nt是相互关联的。nt值可能是3,4或更大值,这样c也会相应有不同的值。

如图4右边cnv重复的区域,c和nt有两个解。但比较左边cnv缺失区域的c值,并参考cnv重复的log2ratio值(logr=0.36),只有c=0.471和nt=4才是正确答案。

因此,当cnv重复区域的nt出现多个可能值时,比较其对应的c值与cnv缺失区域的c值,同时参考其log2ratio值,最终得到满意的结果。

以上显示和描述了本发明的基本原理和主要特征以及本发明的优点,上述实施例和说明书所描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都将落入要求保护的本发明范围内。本发明要求保护的范围由所附的权利要求书及其等效物界定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1