1.一种用于联合检测样本中的snv、cnv和fusion变异的装置,所述装置包括:
测序数据读入模块,用于将原始测序数据比对到参考基因组并排序及去冗余;
snv检测模块,用于检测样本中的所有snv;
cnv检测模块,用于检测样本中目标基因的cnv;
fusion变异检测模块,用于检测样本中的所有fusion变异;和
结果输出模块,用于整合snv检测模块、cnv检测模块和fusion变异检测模块的结果并输出,
其中cnv检测模块包括以下模块:
baf计算模块,用于实施步骤(a)计算每个snp位点的baf值;
baf矫正模块,用于实施步骤(b)对baf进行样本间矫正;
baf分离鉴定模块,用于实施步骤(c)鉴定目标基因上的baf是否存在分离,以及各染色体上是否存在baf分离以评估全基因组的倍型完整程度;
测序深度计算模块,用于实施步骤(d)统计原始测序深度并计算目标基因的logr值;
logr矫正模块,用于实施步骤(e)矫正logr值;
logr背景噪音计算模块,用于实施步骤(f)计算logr的背景噪音水平;和
cnv判定模块,用于实施步骤(g)按照如下规则判定目标基因是否存在cnv:
当样本为整倍体时,
此时如目标基因存在baf分离现象表明该基因存在cnv,此时如该基因的中位logr大于该基因的背景噪音水平或高于给定阈值t1则判定该基因存在扩增,如该基因的中位logr小于该基因的背景噪音水平的相反数或小于给定阈值t2则判定该基因存在缺失;
或此时如果目标基因不存在baf分离现象,此时如该基因的logr大于该基因的背景噪音水平且高于给定阈值t3则判定该基因存在扩增,如该基因的logr小于该基因的背景噪音水平的相反数且小于给定阈值t4则判定该基因存在缺失;
当样本为非整倍体时,
此时如该基因的logr大于该基因的背景噪音水平且高于给定阈值t5则判定该基因存在扩增,如该基因的logr小于该基因的背景噪音水平的相反数且小于给定阈值t6则判定该基因存在缺失。
2.根据权利要求1所述的装置,其中在将原始测序数据比对到参考基因组并排序及去冗余之前,还包括选择snp位点并设计cnv探针的步骤。
3.根据权利要求1所述的装置,其中步骤(c)包括:利用预先生成的baf基线文件对计算的baf值进行矫正,使得各杂合snp的baf在大量样本间的中值在0.5。
4.根据权利要求1-3中任一项所述的装置,其中对于完整二倍体样本的杂合snp,其baf值与0.5的差值大于给定阈值0.05、0.1、0.15或0.2则表明存在cnv。
5.根据权利要求1-3中任一项所述的装置,其中对于肿瘤样本,其baf偏离程度与目标基因的倍型和肿瘤纯度相关。
6.根据权利要求5所述的装置,其中当肿瘤纯度为100%时,baf分布在0.33或0.67附近时表明该基因存在3个拷贝;而当肿瘤纯度为50%时,baf分布在0.33或0.67附近时表明该基因存在loh。
7.根据权利要求1-3中任一项所述的装置,其中步骤(e)包括:利用预先生成的logr基线文件及广义相加模型(gam)对生成的logr值进行矫正,并对矫正后的logr的中位值平移到0值,输出矫正后的logr值。
8.根据权利要求1-3中任一项所述的装置,其中步骤(f)包括:利用logr矫正模块输出的矫正后的logr值信息及cnv检测目标基因集作为输入评估每个目标基因的背景噪音水平,统计除去该目标基因所有探针后logr的sd值作为该目标基因的背景噪音水平并输出。
9.根据权利要求1-3中任一项所述的装置,其中如果大于4条或5条染色体上同时存在baf分离现象,则表明该样本的基因组为非整倍体。
10.根据权利要求1-3中任一项所述的装置,其中如果小于或等于4条或5条染色体上同时存在baf分离现象,则表明该样本的基因组为整倍体。
11.根据权利要求1-3中任一项所述的装置,其中t1为0.1至0.7,t2为-0.7至-0.1,t3为0.1至0.7,t4为-0.7至-0.1,t5为0.1至0.7,和t6为-0.7至-0.1。
12.根据权利要求1-3中任一项所述的装置,其中所述目标基因选自egfr、met、kras、nras、braf、erbb2、alk、kit、tp53、rb1、ret、ros1、fgfr2、ntrk1、ntrk2和ntrk3。
13.根据权利要求1-3中任一项所述的装置,其中所述样本为血浆cfdna。