染色体拷贝数变异程度评估模型、方法及应用与流程

文档序号:30700848发布日期:2022-07-09 19:42阅读:来源:国知局

技术特征:
1.染色体拷贝数变异程度评估模型,其特征在于,所述模型根据拷贝数变异负荷评估染色体拷贝数变异程度,所述拷贝数变异负荷为发生拷贝数变异的bin的数目与全基因组bin的数目的比值。2.根据权利要求1所述的模型,其特征在于,发生拷贝数变异的bin为拷贝数值大于膀胱癌患者拷贝数阈值的bin。3.根据权利要求2所述的模型,其特征在于,拷贝数值logr的计算公式为:。4.根据权利要求3所述的模型,其特征在于,所述膀胱癌患者拷贝数阈值为0.9;所述拷贝数值logr的计算公式中,cfdna样本为尿液上清cfdna样本;待测cfdna样本每个bin的reads数目经过了gc、mappability 以及深度差异的校正;健康人cfdna样本每个bin的reads数目为健康人尿液上清cfdna参考背景数据库的normal panel中的每个bin的reads数目。5.根据权利要求1-4任一项所述的模型,其特征在于,每个bin的长度为1m bp,bin的值非na。6.染色体拷贝数变异程度评估模型的构建方法,所述方法非用于疾病的诊断和治疗目的,其特征在于,步骤包括:构建健康人尿液cfdna参考背景数据库;将临床样本尿液cfdna测序数据与参考基因组比对去重后,进行低深度全基因组拷贝数变异和肿瘤分数检测;设置每个bin的长度,去除值为na的bin,获得全基因组bin数目;使用所述参考背景数据库,统计每个bin的拷贝数值logr,所述logr值的计算公式如下:;计算膀胱癌患者样本尿液中cfdna染色体区域的拷贝数阈值;将拷贝数值大于所述拷贝数阈值的bin判定为发生拷贝数变异的bin;计算发生拷贝数变异的bin数目占全基因组bin数目的比例,获得各临床样本的拷贝数变异负荷;根据所述拷贝数变异负荷,计算灵敏度、特异度和约登指数,选取最佳临界值作为染色体不稳定性为阳性的判断阈值,完成染色体拷贝数变异程度评估模型的构建。7.根据权利要求6所述的方法, 其特征在于,所述参考背景数据库的构建方法,包括如下步骤:提取健康人的尿液上清cfdna进行浅层全基因组测序;测序结果与参考基因组比对去重;对人体除y染色体以外的23个染色体进行bin划分,并计算区域覆盖度;通过整个基因组的平均覆盖度标准化每一个bin的覆盖度,根据参考基因组的gc比例、测序深度和比对的偏好性,进行均一化校正,得到所述参考背景数据库。
8.根据权利要求6所述的方法,其特征在于,所述拷贝数阈值的计算方法,包括如下步骤:分别对正常人样本和膀胱癌患者样本的拷贝数变异值进行皮尔逊相关性检验,剔除弱相关样本;计算每个值非na的bin的拷贝数logr值,并按正常人样本和膀胱癌患者样本分别统计取均值,得到logr
normal
和logr
tumor
;对所有的logr
normal
取均值,计算每个logr
tumor
偏离logr
normal
均值的偏离值,并对偏离值取均值,获得膀胱癌患者拷贝数阈值;计算公式为:;式中,bin个数为去除值为na的bin后的全基因组bin数目。9.根据权利要求6或8所述的方法,其特征在于,所述膀胱癌患者拷贝数阈值为0.9。10.染色体拷贝数变异程度评估方法,所述方法非用于疾病的诊断和治疗目的,其特征在于,用权利要求1-5任一项所述模型计算样本的拷贝数变异负荷,并根据所述拷贝数变异负荷的值评估样本染色体拷贝数变异程度。11.根据权利要求10所述的方法,其特征在于,所述拷贝数变异负荷的计算方法,包括如下步骤:提取尿液上清cfdna样本,进行浅层全基因组二代测序;对测序数据进行序列比对去重,计算每个bin的reads数目;将每个bin的reads数目和健康人尿液上清cfdna参考背景数据库中相应bin的reads数目相比,按照以下公式计算得到拷贝数logr值:;将拷贝数logr值大于膀胱癌患者拷贝数阈值的bin判定为发生拷贝数变异的bin;计算发生拷贝数变异的bin的数目与全基因组bin的数目的比值,获得拷贝数变异负荷。12.根据权利要求11所述的方法,其特征在于,当拷贝数变异负荷高于4%时,样本染色体不稳定性判定为阳性。13.权利要求1-5任一项所述模型在尿路上皮癌患者术后监测中的应用,所述应用非疾病诊断和治疗目的。14.权利要求10-12任一项所述方法在尿路上皮癌患者术后监测中的应用,所述应用非疾病诊断和治疗目的。

技术总结
本发明公开了一种染色体拷贝数变异程度评估模型,该模型根据拷贝数变异负荷评估染色体拷贝数变异程度,所述拷贝数变异负荷为发生拷贝数变异的bin的数目与全基因组bin的数目的比值。本发明还公开了上述模型的构建方法,以及基于该模型的染色体拷贝数变异程度评估方法及其应用。本发明通过构建背景库和染色体拷贝数变异负荷模型,对膀胱癌肿瘤患者尿液上清cfDNA中的染色体不稳定性进行评估,建立了全基因组bin拷贝数水平和患者样本水平的染色体不稳定性评价方法,该方法具有较高的准确性、敏感性和特异性。敏感性和特异性。敏感性和特异性。


技术研发人员:王一凡 金鸽 曹建军 徐小红 陈阅军
受保护的技术使用者:苏州仁东生物工程有限公司
技术研发日:2022.04.19
技术公布日:2022/7/8
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1