检测癌症中微卫星不稳定性的生物标志物组和方法本技术是cn201980016176.7的分案申请。
技术领域:
:1.本发明一般地涉及癌症领域,特别是涉及具有微卫星不稳定性(msi)和/或错配修复(mmr-)缺陷的癌症。这类癌症的实例包括许多结肠直肠、胃和子宫内膜肿瘤。因此,本发明提供了用于分析msi基因座的新诊断标志物组,以及使用所述组用于检测具有微卫星不稳定性(msi)和/或错配修复(mmr-)缺陷的癌症的方法和试剂盒。
背景技术:
::2.在欧洲和美国,每年大约有440,000名患者被诊断患有结肠直肠癌(crc)。最近的指南,例如nccnguidelinesforpatients:coloncancerversion1.2017和esmoclinicalpracticeguidelinesonfamilialrisk-colorectalcancer,建议在所有crc患者进行关于dna错配修复(mmr)缺陷和/或msi状态的肿瘤测试。然而,由于这些测试隐含的技术复杂性,今天这些测试仍未得到充分利用。特别是,很难测试mmr缺乏隐含的所有可能突变,尽管存在筛选它的替代方法,但目前的测定法仍需要在实验室中的大量操作时间,因此不适合成为诊断常规。3.上述障碍自然地影响到管理,并因此潜在地也影响许多癌症患者的存活率。确实,在大量的结肠直肠癌(crc)病例中,发现mmr基因中的缺陷对于肿瘤发生和疾病进展至关重要。例如,mmr基因mlh1的表观遗传沉默占crc的约12%。另有2-5%的病例是由mmr基因mlh1、msh2、pms2或msh6之一中的常染色体显性遗传的功能丧失突变引起的。这种家族性癌症易感性病症被称为林奇综合征或遗传性非息肉性crc(hnpcc),并进一步导致胃癌和子宫内膜癌(等等)的风险增加。4.mmr途径涉及大量基因,并且鉴定出影响其的许多不同的遗传和表观遗传损伤。其他几个可能仍待确认。因此,通过筛查其直接结果来诊断mmr机制中的缺陷更为实用。后者是dna复制错误的全基因组范围内的累积,其可以观察为由于单核苷酸和二核苷酸重复序列(例如(a)n或(ca)n内的缺失或插入而导致的核苷酸数量变化。这种现象称为微卫星不稳定性或msi。当mmr缺乏导致编码区中的msi时,最常见的是产生启动子或移码突变,导致表达的缺乏,截短蛋白的表达,和/或含有新抗原的大量新序列的蛋白质。此外,显示内含子-外显子边界区域中的msi影响rna剪接机制,并因此也干扰蛋白质翻译。总体而言,msi表型与基因组不稳定性、较高的突变率相关,并因此与不同的肿瘤行为和预后相关。5.与微卫星稳定的(microsatellitestable,mss)肿瘤相比,高msi(msi-h)肿瘤通常具有更好的预后和降低的转移可能性。此外,这两种肿瘤类型对不同治疗的反应也不同。例如,早期的msicrc通常对目前是crc治疗金标准(例如webber等,2015)的基于5-氟尿嘧啶的化学疗法没有应答,。另一方面,msi肿瘤表现出至少五个免疫检查点分子的增加水平,这些分子是目前正在临床测试的治疗性抑制剂的靶标(llosa等,2014)。例如,预计具有错配修复缺陷的结肠直肠癌患者对抗pd-1免疫疗法的应答特别好,抗pd-1免疫疗法通过阻断t细胞上的pd-1受体与肿瘤细胞上的pd-l1和pd-l2受体之间的相互作用来发挥作用,使其免疫系统回避机制失效(le等,2015)。基于msi独特的分子足迹,目前还正在对多种其他化合物和生物活性物质(例如喜树碱或伊立替康)测试靶向肿瘤疗法。6.因此,已经认识到,肿瘤中的msi状态鉴定可能对治疗结果产生巨大影响,并因此也对许多癌症患者的生活质量和预期寿命产生巨大影响。许多官方指南已经公开建议在结肠癌和林奇综合征中进行msi检测,这一事实可以最好地证明这一点。它们包括例如nccnguidelinesforcoloncancer,esmoclinicalpracticeguidelinesonfamilialrisk-colorectalcancer,revisedbethesdaguidelines,amsterdamiiclinicalcriteria,usmultisocietytaskforceoncolorectalcancer等。7.当前,两种技术最常用于msi测试;免疫组织化学(ihc)和毛细管电泳。ihc是昂贵的、费力且耗时的技术,其假阴性结果率很高。在毛细管电泳中,荧光pcr用于扩增肿瘤细胞和正常细胞中含有核苷酸重复的特定基因组区域,然后通过比较扩增产物的长度来确定不稳定性的存在。整个基因组中存在成千上万的微卫星基因座,可潜在地用于msi分析(ellegren,natrevgenet.2004)。8.例如,1997年建立并称为贝塞斯达组的一致性msi组包括包括5个微卫星标志物,包括2个长度为25和26个核苷酸的单核苷酸或同核苷酸重复(分别为bat25和bat26)和3个二核苷酸重复(d2s123、d5s346、d17s250)(boland等,1998)。如果30%或以上的标志物(在5标志物组中至少有2个)测试是不稳定的,则使用bethesda组测试的样品被指定为具有高频率的msi或“msi-h”表型。如果五个标志物中有一个(或《30%的肿瘤标志物)得分为msi阳性,则将样品指定为msi低或“msi-l”。最后,如果没有发现标志物发生改变,则认为样品是msi稳定的或“mss”(boland等,1998)。9.然而,尽管作为当前的msi测试标准,贝塞斯达组仍遭受若干缺点,例如基因座在不同种族人群和不同肿瘤类型中的出现率不同。尤其是,它倾向于表现出低敏感性,特别是在最初发展起来的结肠直肠癌以外的癌症中(boland等,1998)。这些因素和其他因素已导致其扩展和/或多样化,在各个临床医生和研究实验室具有另外的标志物,因此导致标准化程度下降和可重复性差。以上的实例包括例如,murphy等,2006和wo2006047412(promega)。备选地,还描述了不与贝塞斯达组中的任何重叠的全新微卫星标志物,例如在wo2013153130(vib)和zhao等,2014(elife)中。10.当前已知方法的另一个缺点是它们的复杂水平,对超出标准实验室热循环仪的专用仪器的需求以及其自动化的有限可行性。经典的贝塞斯达组测试本身就是开放管测试,这增加了交叉污染的机会。此外,它需要专门的实验室人员,并且费时、昂贵且劳动强度大。通常,msi当前存在的检测技术采用以下原理之一:(i)使用荧光标记的引物用于检测贝塞斯达组标志物,然后进行毛细管电泳;(ii)使用dsdna嵌入染料对5个贝塞斯达组标志物进行高分辨率熔解曲线分析;(iii)质谱检测不同长度的等位基因;和(iv)大dna区域(例如外显子组)的下一代测序(ngs),然后计数突变的数量或非匹配设置中的同聚物区域的数量(campbell等,2017,cell)。11.例如,在(i)中,最初基于pcr的贝塞斯达筛选策略需要专家观察员的解释,这阻碍了有效而直接的自动化。然后,关于(ii),使用dsdna嵌入染料的高分辨率熔解曲线分析在一次运行中筛选几种不同msi标志物的多重能力非常有限,因为每个标志物扩增子的熔解温度需要足够不同才能不产生重叠信号。此外,由于该策略依赖于正常和突变长度等位基因之间的异源双链体形成,因此与其他替代方法相比,它的灵敏度也更低。接下来,关于(iii),基于质谱的方法(zhao等,2014)原则上也适用于自动化,但需要专门的仪器和高技能的人员来进行数据解释。最后,关于(iv),ngs无疑具有查看基因组或外显子组中大量msi指示位置的优势,而不仅仅是选择性标志物,并且尽管这种方法原则上也至少部分地自动化,但目前非常昂贵并需要专用的ngs硬件。关于同聚物评分,ngs仍不足以对单个同聚物重复进行重复评分,因为它仍然容易丢失一串重复核苷酸中有关单个核苷酸插入缺失的信息。另外,由于生成大量数据,它仍然耗时、复杂并且需要训练有素的分析人员。12.总之,msi测试代表了很高的医疗需求,由于其技术限制,现有的诊断方法仅能部分满足这些需求。重要的是,这些包括有限的检测能力,高昂的成本和/或周转时间,对专用设备的要求和/或训练有素的专家的解释。本发明通过提供如wo2013153130中所描述的那种仅几个短同聚物msi标志物的高度敏感的集合以及用于检测其序列内的同核苷酸插入或缺失(插入缺失)的极其强健的方法,解决了上述缺点。该方法非常易于自动化,不需要特定的分子基础设施,并且可以使用标准实验室器械(例如连接到计算机的简单热循环仪)执行。另外,它允许所选标志物的容易的双重或甚至更高水平的多重复用,这赋予了甚至进一步限制所需的实验室材料并因此便于在现有的基于pcr的平台上实施的优点。重要的是,该方法提供了非常一致的结果,并允许简单、全自动的解释并以直接报告为输出。在目前的设定下,从接收患者的组织样品,我们表明我们可以在不到3小时的时间内获得插入缺失状态的完全读取。因此,本文提出的新标志物组及其检测方法为检测crc中的msi提供了新的高度有利的替代方法,甚至在其早期阶段(如下文所示),和在其他癌症样品(例如卵巢癌、子宫内膜癌和胃癌)中,以及免疫疗法中的预测和后续研究。继续呈现本发明的这些和其他优点以及用途。发明概述13.本发明在所附独立权利要求中得到定义。优选的实施方式在从属权利要求中得到定义。特别地,本发明涉及用于分析生物学样品中的msi基因座的生物标志物组,该组包括映射至grch38/hg38人参考基因组的以下同聚物重复区域:包含11个连续腺嘌呤的同聚物重复,其定位在人dido1基因并起始于位置chr20:62,905,340;包含11个连续腺嘌呤的同聚物重复,其定位在人mre11基因并起始于位置chr11:94,479,765;包含10个连续腺嘌呤的同聚物重复,其定位在人sulf2基因并起始于位置chr20:47,657,577;和包含8个连续腺嘌呤的同聚物重复,其定位在人acvr2a基因并起始于位置chr2:147,926,117。14.同样重要的是,本发明涉及分析生物学样品中的msi基因座的方法,包括以下步骤:-确定映射至grch38/hg38人参考基因组的以下同聚物重复中的核苷酸数量:包含11个连续腺嘌呤的同聚物重复,其定位在人dido1基因并起始于位置chr20:62,905,340;包含11个连续腺嘌呤的同聚物重复,其定位在人mre11基因并起始于位置chr11:94,479,765;包含10个连续腺嘌呤的同聚物重复,其定位在人sulf2基因并起始于位置chr20:47,657,577;和包含8个连续腺嘌呤的同聚物重复,其定位在人acvr2a基因并起始于位置chr2:147,926,117。15.结合以上内容,本发明还涉及用于分析生物学样品中的msi基因座的试剂盒,该试剂盒包括用于扩增包含至少上述同聚物重复的核酸区域的工具。16.最后,但同样重要的是,本发明还涉及衍生自细胞系htc116cl.110268743的细胞或任何其他材料,特别是遗传材料,细胞系htc116cl.110268743在上述同聚物重复中和在几个有利的其他同聚物重复的每个中包含一个同核苷酸缺失。细胞系htc116cl.110268743系已根据布达佩斯条约在比利时的bccm/genecorner保藏中心成功保藏,登录号为lmbp12278cb。附图说明17.为了更全面地理解本发明的本质,参考以下详细描述并结合附图,其中:图1:显示了128个msi-h结肠直肠癌样品中7个微卫星标志物(btbd7、ryr3、sec31a、acvr2a、dido1、mre11和sulf2)的msi状态。当对样品评估最小集合a)4个标志物以及依次向四个标志物的最小集合中添加标志物的b)、c)和d)时,不同的组显示msi状态(白色,mss;深灰色,msi-h)。单个样品的标志物状态指示为野生型(浅灰色)或突变体(灰色);图2:显示了15个msi-h胃癌样品和19个子宫内膜癌样品中7个微卫星标志物(btbd7、ryr3、sec31a、acvr2a、dido1、mre11和sulf2)的msi状态。当对样品评估最小集合a)4个标志物以及依次向四个标志物的最小集合中添加标志物的b)、c)和d)时,不同的组显示msi状态(白色,mss;深灰色,msi-h)。单个样品的标志物状态指示为野生型(浅灰色)、突变体(灰色)或无结果(斜线)。图3:33个msi-h对比89个mss样品中的突变负荷(通过取代的数量(左图),插入缺失的数量(中间图)或所有突变(右图)测量的)。图4:根据癌症类型,msi-h对比mss样品中的突变负荷(通过体细胞事件(取代和插入缺失)的数量测量的)。em–子宫内膜,crc-结肠直肠。图5a:通过以下测量的msi样品中突变体微卫星标志物的数量从1至6(btbd7、ryr3、sec31a、acvr2a、dido1和mre11)与突变负荷之间的相关性绘图:(a)体细胞取代的数量(在用插入缺失进行校正后,取代的数量和突变体标志物的数量相关,其p值=1.92e-07);或(b)体细胞插入缺失的数量(用取代进行校正后,插入缺失的数量和突变体标志物的数量相关,其p值=7.1e07);(c)msi肿瘤中体细胞取代和插入缺失之间的相关性,显示msi-h样品中体细胞取代和插入缺失之间的高度相关性。对于emmsi肿瘤和crcmsi肿瘤,相关性是一致的,但对于mss肿瘤,则不是。图5b:突变体微卫星标志物的数量与突变负荷之间的相关性绘图,如上面图5a所示,但是用多一个标志物(sulf2)的数据完成的。在(a)中,显示了与体细胞取代的数量的相关性,其中添加多一个标志物将p值改变为6.5e-05。在(b)中,显示了与体细胞插入缺失的数量的相关性,其中添加多一个标志物将p值改变为2e-16。在(c)中,显示了体细胞取代和插入缺失之间的相关性,可以看出,添加多一个标志物进一步改善了msi-h样品中相关性的显著性。图6:作为肿瘤突变负荷(tmb)预测因子的阳性标志物的数量。平均而言,增加一个阳性标志物,观察到多348个取代和多119个插入缺失(图5b中显示的是7个标志物的数据)。图7:与ihc分析相比,与在biocartisidylla平台上实施的本发明的msi测试方法的有效、无效、错误和不一致结果有关的crc肿瘤分期的概述。发明详述18.本发明一般地涉及新msi生物标志物组,利用该组的方法,用于执行所述方法的自动化系统和试剂盒,其中该试剂盒可以优选地包括与所述自动化系统兼容的药筒或以与所述自动化系统兼容的药筒的形式提供并且包括用于检测所述组中插入缺失的工具和优选地还有阳性对照材料。19.在一个优选的实施方案中,本发明提供了用于分析生物学样品中的msi基因座的生物标志物组,该组至少包括映射至grch38/hg38人参考基因组的以下同聚物重复区域或其突变形式(由此突变是同聚物重复序列中至少一个插入缺失的存在):包含11个连续腺嘌呤的同聚物重复,其定位在人dido1基因并起始于位置chr20:62,905,340;包含11个连续腺嘌呤的同聚物重复,其定位在人mre11基因并起始于位置chr11:94,479,765;包含10个连续腺嘌呤的同聚物重复,其定位在人sulf2基因并起始于位置chr20:47,657,577;和包含8个连续腺嘌呤的同聚物重复,其定位在人acvr2a基因并起始于位置chr2:147,926,117。20.我们测试了如wo2013153130(vib)中公开的类型的许多随机选择的标志物,其是明显短于贝塞斯达组的同聚物。从本文所公开的56个标志物的优选集合中随机选择较少数量的标志物不能产生能够以最少且最基本的实验室资源在大范围的人癌症样品上重复检测msi-h表型的强健测定法。这些标志物或者不能在多重或甚至是双重反应中检测到,或者在不同人种族之间的核苷酸数量不同。偶然选择的包含定位在人acvr2a基因并起始于位置chr2:147,926,117的8个连续腺嘌呤的外显子同聚物重复(其在wo2013153130的56个的优选集合中未公开)以及包含定位在人mre11基因并起始于位置chr11:94,479,765的11个连续腺嘌呤的外显子同聚物重复(其在wo2013153130中完全没有公开)令人惊讶地导致获得了用于人mmr缺陷肿瘤中msi检测的高性能组。21.我们观察到,本文提出的仅4个标志物的最小组的性能超过了设定为95%正确鉴定msi-h验证的人结肠直肠癌样品的最小可接受性能。如以下示例性部分所示,我们表明本发明的上述最小组可以成功地从128个msi-hcrc样品库中回收123个msi-h阳性样品,占正确鉴定为msi-h的样品的96%。因此,在一个优选的实施方案中,提供了具有正确鉴定至少90%,优选地至少95%的msi-h肿瘤样品的性能的组。22.逻辑上,添加其他标志物可以逐渐提高该性能。因此,在一个优选的实施方式中,本发明提供了根据前述实施方式的组,并且还包括映射至grch38/hg38人参考基因组的以下三个同聚物重复区域或其突变形式中的任何一个、两个或全部:包含10个连续腺嘌呤的同聚物重复,其定位在人btbd7基因并起始于位置chr14:93,241,685;包含9个连续胸腺嘧啶的同聚物重复,其定位在人sec31a基因并起始于位置chr4:82,864,412;包含10个连续腺嘌呤的同聚物重复,其定位在人ryr3基因并起始于位置chr15:33,865,341。23.构成本发明的生物标志物组的本文呈现的同聚物重复标志物仅仅是最多11个重复性的同核苷酸的短串,例如,在dido13’utr中的11个连续腺嘌呤。如本领域技术人员将理解的,其互补的序列,例如与在dido13’utr序列中11个连续腺嘌呤互补的11个连续胸腺嘧啶也应解释为落入本文以上术语的范围内。24.在一个特别优选的实施方案中,以包括映射至grch38/hg38人参考基因组的五个以下同聚物重复区域或其突变形式的形式提供所述组:包含11个连续腺嘌呤的同聚物重复,其定位在人dido1基因并起始于位置chr20:62,905,340;包含11个连续腺嘌呤的同聚物重复,其定位在人mre11基因并起始于位置chr11:94,479,765;包含10个连续腺嘌呤的同聚物重复,其定位在人sulf2基因并起始于位置chr20:47,657,577;包含8个连续腺嘌呤的同聚物重复,其定位在人acvr2a基因并起始于位置chr2:147,926,117;和包含10个连续腺嘌呤的同聚物重复,其定位在人btbd7基因并起始于位置chr14:93,241,685。使用五个标志物的这一核心集合,128个肿瘤样品中的124个,即97%可以被鉴定为msi-h。25.在另一个优选的实施方案中,以包括映射至grch38/hg38人参考基因组的六个以下同聚物重复区域或其突变形式的形式提供所述组:包含11个连续腺嘌呤的同聚物重复,其定位在人dido1基因并起始于位置chr20:62,905,340;包含11个连续腺嘌呤的同聚物重复,其定位在人mre11基因并起始于位置chr11:94,479,765;包含10个连续腺嘌呤的同聚物重复,其定位在人sulf2基因并起始于位置chr20:47,657,577;包含8个连续腺嘌呤的同聚物重复,其定位在人acvr2a基因并起始于位置chr2:147,926,117;包含10个连续腺嘌呤的同聚物重复,其定位在人btbd7基因并起始于位置chr14:93,241,685;和包含9个连续胸腺嘧啶的同聚物重复,其定位在人sec31a基因并起始于位置chr4:82,864,412。通过将定位在sec31a基因的另外的标志物进一步添加到标记物的核心集合,可以将所有128个样品评分为msi-h,从而使所述组在确定msi状态方面更加有效。26.在又一个优选的实施方案中,以包含映射至grch38/hg38人参考基因组的以下七个同聚物重复区域或其突变形式的形式提供所述组:包含11个连续腺嘌呤的同聚物重复,其定位在人dido1基因并起始于位置chr20:62,905,340;包含11个连续腺嘌呤的同聚物重复,其定位在人mre11基因并起始于位置chr11:94,479,765;包含10个连续腺嘌呤的同聚物重复,其定位在人sulf2基因并起始于位置chr20:47,657,577;包含8个连续腺嘌呤的同聚物重复,其定位在人acvr2a基因并起始于位置chr2:147,926,117;包含10个连续腺嘌呤的同聚物重复,其定位在人btbd7基因并起始于位置chr14:93,241,685;包含9个连续胸腺嘧啶的同聚物重复,其定位在sec31a基因并起始于位置chr4:82,864,412;和包含10个连续腺嘌呤的同聚物重复,其定位在人ryr3基因并起始于位置chr15:33,865,341。计算上述七个标志物的集合以将潜在的假阴性率降低到~1/1900。因此,添加与先前实施方案的组兼容的又另一个标志物提供了进一步的性能保障,特别是用于在除结肠直肠癌以外的癌症(例如卵巢癌、子宫内膜癌或胃癌)中检测msi时实施该组。27.在一个优选的实施方式中,生物学样品源自怀疑患有肿瘤的个体。在另一个实施方案中,所述生物学样品是肿瘤样品,可能是新鲜组织或固定的肿瘤样品,例如冷冻的或ffpe样品。在一个特别优选的实施方案中,肿瘤选自结肠直肠、卵巢、子宫内膜或胃肿瘤。在另一个可能的实施方案中,样品是液体活检样品。在另一个可能的实施方案中,样品是来自怀疑患有林奇综合征的患者的任何组织样品,例如外周血单核细胞(pbmc)或其他白血细胞,或皮肤组织。28.本发明的另一个目的是提供分析生物学样品中的msi基因座的方法,该方法包括确定上述实施方案的生物标志物组中的核苷酸数量的步骤。29.因此,在本发明的一个实施方案中,提供了用于分析生物学样品中的msi基因座的方法,包括以下步骤:-确定映射至grch38/hg38人参考基因组的以下同聚物重复中的核苷酸数量:包含11个连续腺嘌呤的同聚物重复,其定位在人dido1基因并起始于位置chr20:62,905,340;包含11个连续腺嘌呤的同聚物重复,其定位在人mre11基因并起始于位置chr11:94,479,765;包含10个连续腺嘌呤的同聚物重复,其定位在人sulf2基因并起始于位置chr20:47,657,577;和包含8个连续腺嘌呤的同聚物重复,其定位在人acvr2a基因并起始于位置chr2:147,926,117。30.由于与上述相同的原因,在一个优选实施方案中,本发明的方法还包括确定映射至grch38/hg38人参考基因组的以下同聚物重复区域的任何一个、两个或所有中的核苷酸数量:包含10个连续腺嘌呤的同聚物重复,其定位在人btbd7基因并起始于位置chr14:93,241,685;包含9个连续胸腺嘧啶的同聚物重复,其定位在人sec31a基因并起始于位置chr4:82,864,412;包含10个连续腺嘌呤的同聚物重复,其定位在人ryr3基因并起始于位置chr15:33,865,341。31.在一个特定实施方案中,提供了方法,包括以下步骤:-确定映射至grch38/hg38人参考基因组的五个以下同聚物重复中的核苷酸数量:包含11个连续腺嘌呤的同聚物重复,其定位在人dido1基因并起始于位置chr20:62,905,340;包含11个连续腺嘌呤的同聚物重复,其定位在人mre11基因并起始于位置chr11:94,479,765;包含10个连续腺嘌呤的同聚物重复,其定位在人sulf2基因并起始于位置chr20:47,657,577;包含8个连续腺嘌呤的同聚物重复,其定位在人acvr2a基因并起始于位置chr2:147,926,117;和包含10个连续腺嘌呤的同聚物重复,其定位在人btbd7基因并起始于位置chr14:93,241,685。32.在一个更具体的实施方案中,提供了方法,包括以下步骤:-确定映射至grch38/hg38人参考基因组的六个以下同聚物重复中的核苷酸数量:包含11个连续腺嘌呤的同聚物重复,其定位在人dido1基因并起始于位置chr20:62,905,340;包含11个连续腺嘌呤的同聚物重复,其定位在人mre11基因并起始于位置chr11:94,479,765;包含10个连续腺嘌呤的同聚物重复,其定位在人sulf2基因并起始于位置chr20:47,657,577;包含8个连续腺嘌呤的同聚物重复,其定位在人acvr2a基因并起始于位置chr2:147,926,117;包含10个连续腺嘌呤的同聚物重复,其定位在人btbd7基因并起始于位置chr14:93,241,685;和包含9个连续胸腺嘧啶的同聚物重复,其定位在人sec31a基因并起始于位置chr4:82,864,412。33.在另一个特定实施方案中,提供了方法,包括以下步骤:-确定映射至grch38/hg38人参考基因组的七个以下同聚物重复中的核苷酸数量:包含11个连续腺嘌呤的同聚物重复,其定位在人dido1基因并起始于位置chr20:62,905,340;包含11个连续腺嘌呤的同聚物重复,其定位在人mre11基因并起始于位置chr11:94,479,765;包含10个连续腺嘌呤的同聚物重复,其定位在人sulf2基因并起始于位置chr20:47,657,577;包含8个连续腺嘌呤的同聚物重复,其定位在人acvr2a基因并起始于位置chr2:147,926,117;包含10个连续腺嘌呤的同聚物重复,其定位在人btbd7基因并起始于位置chr14:93,241,685;包含9个连续胸腺嘧啶的同聚物重复,其定位在人sec31a基因并起始于位置chr4:82,864,412;和包含10个连续腺嘌呤的同聚物重复,其定位在人ryr3基因并起始于位置chr15:33,865,341。34.在可能的实施方案中,如果在至少两个所述同聚物重复中检测到插入缺失,则本发明的方法可以还包括诊断生物学样品的msi状态的步骤。35.优选地,提供本发明的方法,其中获自受试者的生物学样品是肿瘤或潜在的肿瘤样品。原则上,本文公开的方法可以使用任何确认的或潜在的肿瘤样品执行。在一个优选的实施方案中,肿瘤是结肠直肠、胃、卵巢或子宫内膜肿瘤。36.如本领域技术人员将理解的,本发明的同聚物重复标志物组的性质决定了本发明的方法将优选地使用生物学样品中存在的基因组dna执行。根据样品类型,在一个优选的实施方案中,本发明的方法之前进行以下任何步骤:-从核酸源中释放和/或分离可能包含靶序列的核酸,-将所述可能包含靶标的释放的和/或纯化的核酸提供给扩增所述核酸的步骤。37.由于基因组dna是丰富而复杂的核酸材料,有利的是在确定其中的核苷酸数量的步骤之前,将上述定义的同聚物重复区域侧翼的序列进行扩增。因此,在一个优选的实施方案中,提供了方法,其中还包括以下步骤:-扩增包含上述同聚物重复的核酸区域。对本领域技术人员显而易见的是,这种扩增将产生包含同聚物重复序列的扩增产物,而不管其msi状态如何。也就是说,此类扩增产物可以包含给定的同聚物重复或其msi变体的野生型(wt)版本,即,在同聚物重复序列中包含至少一个同核苷酸的插入缺失的突变体。38.自然地,在一个明显的实施方案中,优选地通过聚合酶链反应(pcr)执行扩增,例如使用用于执行pcr的手段,例如适当的试剂和/或包括热循环仪的装备。但是,也可以使用本领域已知的其他扩增技术。这些包括但不限于环介导的等温扩增(lamp)、基于核酸序列的扩增(nasba)、链置换扩增(sda)、多重置换扩增(mda)、滚环扩增(rca)、连接酶链反应(lcr)、解旋酶依赖性扩增(hda)或分枝扩增方法(ramificationamplificationmethod,ram)。39.在一个优选的实施方案中,提供了方法,其中扩增的步骤包括使用至少一个引物,其具有以下seqidno.:1-14中的任何一个所确认的序列:对于dido1标志物:seqidno.:1-tagcgtgtgaatcggacatseqidno.:2-ttgactgggcagatagggga对于mre11标志物:seqidno.:3-atagttcacccatggaaaccseqidno.:4-ggaggagaatcttagggaaa对于btbd7标志物:seqidno.:5-actggactcccgctggseqidno.:6-cgctcagcctccataaatc对于sulf2标志物:seqidno.:7-caacttcatttcttttcagtaccttseqidno.:8-ctgtccagataccatttctc对于acvr2a标志物:seqidno.:9-agcatccatctcttgaagacatseqidno.:10-gcatgtttctgccaataatctct对于sec31a标志物:seqidno.:11-caacttcagcaggctgtseqidno.:12-agtctgagaagcatcaatttt对于ryr3标志物:seqidno.:13-cattttctaaatgcctcccttaaaseqidno.:14-gtccattaggcacaaaaag40.在一个更具体的实施方案中,扩增的步骤包括使用选自以下的至少一个引物对:seqidno.:1和seqidno.:2;seqidno.:3和seqidno.:4;seqidno.:5和seqidno.:6;seqidno.:7和seqidno.:8;seqidno.:9和seqidno.:10;seqidno.:11和seqidno.:12;seqidno.:13和seqidno.:14。41.如本领域技术人员将理解的,取决于扩增条件,以上列出的引物序列也可能在它们中的1个、2个或在某些情况下甚至3个核苷酸被改变(即添加、删除或者被不同的核苷酸或修饰的核苷酸取代)的情况下起作用。因此,在一个可能的实施方案中,本发明还提供了由上述seqidno.:1-14中的任何序列所确认的至少一个引物序列,其中1、2或3个核苷酸被改变。在备选的实施方案中,本发明还提供了与上述seqidno:1-14中的任何序列至少80%,优选地至少85%,更优选地至少90%,或最优选地至少95%相同的至少一个引物序列。如本领域技术人员将理解的,为了生成覆盖感兴趣的同聚物重复区域的扩增子,可以将替代引物设计成相对于上述引物对的位置而言上游或下游5、10、20、50或100个核苷酸。因此,此类替代引物对也应被视为本发明备选的显而易见的实施方案。42.本文提供的方法具有可以完全自动化并且适用于任何标准的定量pcr热循环仪的优点,这使得它可以由常规的实验室人员执行,而无需专门的培训。除了上述之外,该方法是高度灵敏的,适合多重复用的,可以提供对检测的同聚核苷酸重复序列及其变体的相对量的估计。因此,在一个可能的实施方案中,所述pcr可以是定量或半定量pcr。43.由于本发明的方法涉及检测非常短(即《12nt)的同核苷酸重复序列串中同核苷酸的数量的变化,因此它们具有高特异性是有利的。例如,在同聚物重复区域的扩增期间,已知发生聚合酶滑移。这导致复制原始数量的重复核苷酸时出错,引起在扩增的pcr产物中人工缺失或插入的积累。因此,在一个优选的实施方案中,扩增的步骤是使用校对聚合酶,即具有3’‑5’核酸外切酶活性的聚合酶执行的。许多这样的pcr级聚合酶是已知的并且商购可得。实例包括但不限于q5、pfx、pfu、extaq等聚合酶。44.在最优选的实施方案中,在确定核苷酸数量的步骤中使用扩增的核酸产物的熔解曲线分析。因此,在本发明方法的一个特别有利的实施方案中,扩增的步骤导致生成熔解曲线数据。45.熔解曲线分析是对温度变化期间双链核酸分子的解离或缔合特征的评估。因此,熔解曲线数据应理解为代表所研究的核酸分子(例如核酸扩增的靶产物)的解离或缔合特征的任何捕获数据。熔解曲线数据可以通过在被研究的样品中包含适当的荧光部分来获得,样品可通过进行扩增的任何仪器或方法(例如热循环、pcr、定量pcr等)处理。这可以从配备有将样品温度调节至高于dna样品的熔解温度的手段的任何装置获得,其配备有已知的荧光或分光光度手段。此类仪器的实例包括但不限于通常用于qpcr的常规光学热循环仪或带有温度控制的荧光计等。46.熔解曲线分析和高分辨率熔解(hrm)分析是用于检测和分析样品中核酸序列的存在的常用方法。监测核酸的解离和缔合特性的一种方法是借助染料。用于qpcr和熔解曲线分析的检测化学法依赖于(a)通常检测靶标结合染料(例如dna结合荧光团,例如lcgreen、lcgreen+、evagreen、syto9cybrgreen)的荧光的化学法,或(b)靶向通常使用荧光团标记的dna探针的特定化学法,例如信标探针和/或引物,例如蝎子引物。在本领域中众所周知,可以将其他检测化学法应用于熔解曲线分析中。47.在本发明的一个实施方案中,在熔解曲线测试过程中,在一种或多种嵌入染料的存在下加热扩增产物。加热期间dna的解离可以通过其导致的荧光大量减少来测量。在另一个特定的实施方案中,在熔解曲线测试过程中,在一种或多种染料标记的核酸例如一个或多个探针的存在下加热扩增产物。在基于探针的荧光熔解曲线分析的情况下,核酸中的变异检测基于探针-靶杂交体的热变性生成的熔解温度。随着生成的扩增子的加热的进行,以温度函数(通常在整个温度间隔内)检测信号强度随温度的变化,以获得熔解曲线原始数据。48.在本发明方法的优选实施方案中,扩增包括使用探针。原则上,在可能的实施方案中,可以使用适合执行熔解曲线分析的任何靶标特异性寡核苷酸探针。优选的已知探针可以包括由荧光团和猝灭剂组成的一对,并且还可以有利地形成二级结构,例如环或发夹。49.特别优选的是分子信标探针或分子信标,其是具有内部淬灭的荧光团的发夹状分子,当它们结合至靶核酸序列时其荧光得以恢复。因此,分子信标不会因聚合酶的作用而降解,并且可用于通过熔解曲线研究与其靶标的杂交动力学。典型的分子信标探针长约20个核苷酸,优选地25个核苷酸或更长。通常,与靶序列互补并结合的区域是18-30个碱基对长。分子信标的结构和工作机制是本领域众所周知的。50.因此,在一个特别优选的实施方式中,提供了方法,其中扩增的步骤包括使用至少一个分子信标探针。51.在上述实施方案的一个优选实施方案中,分子信标探针包含与突变体同聚物核苷酸重复序列相同或互补的序列,该突变体同聚物核苷酸重复序列在靶标同聚物核苷酸重复序列中包含至少一个同核苷酸的缺失。这种分子信标设计允许以高灵敏度和特异性检测所选择的突变的msi标志物,而同时保持对野生型(即预期的)标志物的足够敏感性。应当指出的是,术语“靶标同聚物核苷酸重复序列”是指在不存在msi的条件下所期望的野生型或参考同聚物重复序列。相反,“突变体同聚物核苷酸重复序列”是指这样的同聚物核苷酸重复序列,其中包含至少一个同核苷酸的插入或缺失。然后将测量野生型和突变体的原始熔解数据之间的差异,并将其作为熔解曲线原始数据的特征。52.在一个具体的实施方案中,提供了方法,其中至少一个分子信标探针具有由以下seqidno中的任何一个所确认的序列:53.在一个可能的实施方案中,提供了所述至少一个分子信标探针,其相对于上述seqidno:15-21具有一定程度的序列变异。此类变异可能是由于使用了不同的信标茎序列(上面的带有下划线和斜体),或者是由于删除了或向信标的杂交部分添加了对要检测的序列具有特异性的核苷酸(上面的粗体表示)。后者可以包括在同聚物重复序列中添加或删除1个或2个核苷酸,或在所述重复的侧翼序列中包含或多或少的核苷酸。54.由于给定的分子信标探针对一个同聚物重复标志物及其不稳定(突变体)变体具有如此特异性,因此还可以设计多重测定法,其中至少两个、可能更多个分子信标探针在一个反应管或隔室中应用。55.因此,在另一个优选的实施方案中,提供了方法,其中扩增的步骤包括一对同聚物重复的至少一个双重扩增,所述对选自以下组合:-双重扩增:包含11个连续腺嘌呤的同聚物重复,其定位在人dido1基因并起始于位置chr20:62,905,340;和包含11个连续腺嘌呤的同聚物重复,其定位在人mre11基因并起始于位置chr11:94,479,765;-双重扩增:包含8个连续腺嘌呤的同聚物重复,其定位在人acvr2a基因并起始于位置chr2:147,926,117;和包含9个连续胸腺嘧啶的同聚物重复,其定位在人sec31a基因并起始于位置chr4:82,864,412;和-双重扩增:包含10个连续腺嘌呤的同聚物重复,其定位在人btbd7基因并起始于位置chr14:93,241,685;和包含10个连续腺嘌呤的同聚物重复,其定位在人sulf2基因并起始于位置chr20:47,657,577。56.在高度改进本发明方法的强健性的特别有利的实施方案中,特别是当使用多重复用时,使用新方法,其中将小波变换函数应用于原始的熔解曲线数据。57.小波是数学函数,其将数据分割成不同的频率分量,然后以与其比例匹配的分辨率研究每个分量。这些基本函数是持续时间有限的短波。小波变换的基本函数相对于频率缩放。有许多不同的小波可以用作基本函数。基本函数~(t),也称为母小波,是变换函数。术语母表示在变换过程中使用的具有不同支持区域的函数衍生自一个主要函数或母小波。换句话说,母小波是用于生成其他窗口函数的原型。通常,小波ψ(t)是复数值函数。一般的小波函数定义为:ψs,τ(t)=|s|-1/2ψ[(t-τ)/s]该移位参数“τ”确定了时间上的窗口位置,从而定义了信号x(t)的哪一部分正在被分析。在小波变换分析中,频率变量“ω”由比例变量“s”代替,时移变量由“τ”表示。[0058]小波变换利用这些母小波函数,并且执行将信号x(t)分解成缩放的小波函数ψ(t)的加权集合。使用小波的主要优点是,它们允许捕获给定的更大和更复杂的数据集的特征性的和独特的标志,而不会导致数据丢失。[0059]例如,从两个长度仅一个核苷酸不同的扩增产物获得的两个大的原始熔解曲线数据集高度相似,但是在应用小波变换后将产生两个不同的标志。因此这样的标志将更易于彼此比较,以便一致地得出结论:在一种扩增产物中存在插入或缺失。总之,在处理大型和相似数据集时,小波函数的应用导致噪声降低并提高计算效率和速度。因此,经过小波处理的数据特别适合在一个实验中对涉及多个多重复用靶标的组合分析的样品进行分类,特别是当生成的大型原始数据集需要区分微小数据变化时,尤其如此。[0060]当前用于msi检测的方法具有以下缺点:(a)为确定重复长度,它们需要额外的专用器械来执行pcr后分析和/或通常需要由训练有素的专家来解释这种分析;或者(b)在使用dsdna插入染料的高分辨率熔解曲线的情况下,缺点是多重复用能力非常有限,以避免来自不同扩增子的熔解信号重叠,而且,它无法量化不稳定(突变体)序列对稳定(野生型)序列的相对量。我们观察到在熔解曲线数据上应用离散小波变换可以以完全自动化的方式对结果进行非常强健且一致的解释,从而克服了这些缺点。[0061]因此,在一个优选的实施方案中,本发明的方法还包括以下步骤:(a)在熔解曲线数据上应用小波变换;和(b)使用从(a)获得的结果来确定上述任何同聚物重复中的核苷酸数量。换句话说,在一个实施方案中,提供了方法,其应用小波变换函数来分析来自测试样品的核酸的熔解曲线数据以确定来自所选择的生物标志物组的每个同聚物重复中是否存在插入缺失,然后可以使用这些信息将所述测试样品分类为是否具有msi。[0062]在一个优选的实施方案中,熔解曲线数据是原始熔解曲线数据,即代表从核酸解离或缔合实验获得的信号的原始度量的数据。换句话说,这种原始度量没有被例如数学方法处理,如本领域中经常进行的那样应用一阶或二阶导数熔解曲线分析,而是在通过检测器收集它们之后,将它们发送到计算机,在其中将小波变换函数应用于它们。[0063]在一个最优选的实施例中,小波变换是离散小波变换(discretewavelettransform)或“dwt”。dwt是对小波进行离散采样的任何小波变换。与其他小波变换一样,它与傅立叶变换相比的一个关键优势是时间分辨率:它捕获频率和位置信息(时间上的位置)二者。将离散小波变换应用于原始度量产生不同缩放的重建输出小波系数集合:(a)一个是近似输出,它是输入信号分量的低频成分,和(b)另一个是多维输出,它给出高频分量,即各个电平输入信号的细节。这些系数进一步称为离散小波变换系数或dwt系数。将特征分成不同的缩放(或频率)可以使操作员或计算机算法选择与某些决策或分析最相关的dwt系数,这一过程通常称为小波滤波。该过程可以重复应用,将信号分成多个频带。当应用于熔解曲线数据时,频率最高的小波系数主要是噪声,而分辨率最低的系数则捕获与之前扩增反应中的仪器增益或扩增效率有关的信息。两者与在经历熔解曲线分析的样品中的特定寡核苷酸的鉴定几乎没有相关性,但是在这种鉴定的可靠性方面可能具有相关性。已经描述了包含计算和绘制dwt所需的所有功能的软件包(aldrich,2015),并且对于熟练的程序员和数学家来说是已知的。[0064]在该方法的一个优选的实施方案中,对熔解曲线数据执行离散小波变换以产生dwt系数的步骤将在特定设置下使用daubechies家族的母小波来计算原始数据或归约数据(reductiondata)的一维(1d)小波变换。母小波是未经修改的小波,选择作为离散小波变换的基础(daubechies,1992)。当使用db8母小波时,获得了良好的结果。使用db4和haar母小波的其他测试也提供了非常满意的性能,可以根据要求提供结果。基于后者,我们认为其他现有的母小波也可能适用。可以并且优选地随后使用金字塔dwt算法对母小波进行扩张、移位和缩放,以生成子小波的集合,其最能代表待分析的荧光熔解曲线信号;从算法中获得的小波和缩放系数的集合是离散小波变换的结果。在指定的实例中,dwt的边界条件是周期性的。输入到变换的原始数据可以是所测量的整个数据或覆盖给定实验的所有重要事件的子集。[0065]符合以上所述,为了产生dwt系数,本发明的方法可以将离散小波变换应用于原始熔解曲线数据,或者应用于被数学地变换或简化的熔解曲线数据,即仅应用于原始数据的选择。[0066]此外,并非所有的dwt系数都必须始终用于核苷酸数的最终确定。为了提高计算速度,仅选择dwt系数即可。优选地,对原始熔解曲线数据执行离散小波变换。然而,可选地,可以根据本领域中已知的任何数学方法对原始数据执行数据归约(datareduction)以生成原始数据的选择。在后一种情况下,离散小波变换将应用于原始数据的所述选择,以也产生dwt系数。总之,在一个特定实施例中,从(a)获得的结果可以是从原始熔解曲线数据获得的dwt系数。在一个替代实施方案中,从(a)获得的结果可以是从原始熔融曲线数据的选择获得的dwt系数。在又另一个特定实施例中,从(a)获得的结果可以是从以上替代实施方式中的任一个获得的dwt系数的选择。[0067]在一个特定实施方案中,离散小波变换是一维离散小波变换。在一个甚至更具体的实施例中,一维离散小波变换是一维daubechies小波变换。[0068]为了应用离散小波变换,需要选择母小波。在进一步优选的实施方案中,应用daubechies离散小波变换,它使用来自daubechies家族的母小波,最优选的是db8母小波或者db4或haar母小波。[0069]原则上,在备选的可能实施方案中,适用于生成捕获允许在单核苷酸水平上进行区分的信息的显著性系数的任何小波变换函数都可以在本发明的方法中使用。可能的实例包括haar小波(也可以视为daubechies家族的部分),最小非对称,余弦或最佳局部化。替代实施方案可以使用替代算法来计算dwt,包括提升算法或双树复数小波变换(dual-treecomplexwavelettransform)。离散小波变换的其他形式包括非抽样或未抽取小波变换(其中省略了下采样)或纽兰德变换(其中小波的正交基由频率空间中适当构造的礼帽式滤波器形成)。其他实例可能存在并且将由适当的技术人员容易地应用于本文公开的方法。[0070]本发明方法的主要优点之一是其直接的自动化和适应性,尤其是对于已知的标准qpcr系统。因此,在一个特定的实施方案中,提供了方法,其中以自动化的方式,例如通过软件,执行确定上面列出的同聚物重复中的核苷酸数量。这可以在例如配备有适当的硬件和软件布置的自动化系统上完成,该自动化系统可以读取从本发明的方法获得的信号,对其进行分析,并就来自给定样品的选择标志物中是否存在插入缺失提供结论。用于此类自动化的一种特别合适的系统是biocartisidyllatm平台,该平台除了执行pcr并提供其结果的解释外,还可以完全自动化整个样品处理和核酸分离工作流程。因此,在一个可能的实施方案中,本发明提供了用于分析msi基因座的全自动化样品到结果方法。[0071]在本发明的又另一个引人注目的实施方案中,执行方法,其中在对照生物学样品中还执行确定任何上面列出的同聚物重复中的核苷酸数量。这样的对照或参考标准样品可以例如是衍生自msi-h肿瘤的物质,该物质被证实在任何上面列出的所选同聚物重复中具有插入缺失,或者是合成或分离的核酸构建体,例如质粒。一个特别有利的参考标准可以是例如,acrometrix标准之一,其包含合成的dna和基因组dna的混合物。该技术使用了高度表征的和测序的细胞系gm2438作为基因组背景dna,在其中插入了测序的合成靶标。在acrometrix方法中,这些靶标是线性的合成dna分子,包含模拟与例如选择的生物标志物相关的改变的序列,在本发明的上下文中它可以是任何上述包含插入缺失的同聚物重复的序列(优选地用于pcr目的)以及它们的侧翼序列。靶标还包含缀合至上述模拟改变的序列的“尾巴”序列,其进一步用于鉴定和定量目的。所得的序列认为是杂合序列,包含模拟改变的序列和尾巴序列。尾巴例如可以模拟有检测测定法可供利用的基因中的已知改变(例如snp),因此它可以提供用于间接地绝对定量模拟改变的序列的一种另外的方法,如在这种情况下,所选的一个或多个标志物中的插入缺失。这样的标准可以是例如用于验证和确认目的,例如在设想进行进一步的ngs研究的情况下,尤其是在当前的ngs方法仍倾向于丢失关于同聚物重复序列中插入缺失信息的情况下。[0072]备选地,在本发明的一个优选的实施方案中,对照生物学样品包含衍生自htc116cl.110268743细胞系的材料,该细胞系根据本发明的目的而产生并根据布达佩斯条约于2017年11月28日保藏在比利时的bccm/genecorner保藏中心,登录号为lmbp12278cb。该细胞系在每个上述同聚物重复中包含一个同核苷酸缺失。这意味着该细胞系的基因组包含以下突变体(即msi变体)同聚物重复序列:定位在人dido1基因并起始于位置chr20:62,905,340的10个腺嘌呤;定位在人mre11基因并起始于位置chr11:94,479,765的10个腺嘌呤;定位在人sulf2基因并起始于位置chr20:47,657,577的9个腺嘌呤;定位在人acvr2a基因并起始于位置chr2:147,926,117的7个腺嘌呤;定位在人btbd7基因并起始于位置chr14:93,241,685的9个腺嘌呤;定位在人sec31a基因并起始于位置chr4:82,864,412的8个胸腺嘧啶;和定位在人ryr3基因并起始于位置chr15:33,865,341的9个腺嘌呤。此外,细胞系还包含其他几个msi相关重复的插入缺失,例如来自贝塞斯达组的bat25和bat26,其可用于比较研究。[0073]在一个相关方面,本发明还提供了衍生自细胞系htc116cl.110268743的细胞或任何其他材料,特别是遗传材料。这种材料可以是分离的基因组dna或细胞裂解物。取决于本文提供的方法和基于所述方法的试剂盒的最终设计,这种材料的其他合适形式对于技术人员将是显而易见的。[0074]在另一方面,本发明还提供了用于检测本发明的msi生物标志物组中的插入缺失或用于执行根据本发明的方法的试剂盒。在一个特定的实施方案中,本发明提供了用于分析生物学样品中的msi基因座的试剂盒,该试剂盒包括用于检测核酸区域的工具,该工具包括本发明的生物标志物组中提供的上述同聚物重复。优选地,所述工具是序列特异性的,即设计为以序列特异性方式识别所述同聚物重复以及其选定长度的侧翼区域。在一个优选的实施方案中,所述序列特异性工具包括能够与包含同聚物重复的区域杂交的引物或引物对或探针。例如,这样的工具可以优选地包括与重复的上游或下游区域杂交并且设计为在扩增反应中生成包含至少一个所述同聚物重复或其突变形式(例如与野生型同聚物重复形式相比,包含少或多一个或两个同核苷酸)的扩增产物的引物。在另一个实例中,所述工具可以包括能够与任何所述同聚的重复序列(或其包含插入缺失的突变形式)和所述重复序列的至少一个直接侧翼区域(即上游或下游,但优选两者)杂交的探针。在一个具体的实施方案中,所述工具包括选自seqidno:1-14的至少一个引物或引物对。在一个替代的具体实施方案中,所述工具包括选自seqidno:15-21的至少一种分子信标探针。在一个可能的实施方案中,所述工具包括选自seqidno:1-14的至少一个引物或引物对和选自seqidno:15-21的至少一个分子信标探针。所述工具可以还包括例如,校对聚合酶、适当的缓冲系统、dntp、可能带有兼容猝灭剂的染料选择等。在进一步的实施方案中,提供了包括对照生物学样品材料,优选地是衍生自htc116cl.110268743细胞系的材料的试剂盒。[0075]在一个优选的实施方式中,提供了还包括药筒(cartridge)的试剂盒。可能地,试剂盒可以以药筒的形式提供。因此,有利地,本发明提供了试剂盒,其中所述用于检测包含上述生物标志物组同聚物重复的核酸区域的工具提供在可与自动化系统接合的药筒中。如上所述,药筒和可与其接合的自动化系统的一个合适实例是biocartisidyllatm平台。可以在wo2007004103、ep1896180、ep1904234和ep2419705中找到其进一步的细节并且类似地适用于本发明的系统。从本文引用的文献中可以理解,有利的药筒不仅包括用于执行pcr的手段,而且可以设计成直接接受核酸或样品的来源,从所述核酸来源分离或释放核酸,并提供(例如通过泵送)如此释放的核酸用于随后的基于pcr的测定法。[0076]在一个优选的实施方式中,可以以斑点形式在所述药筒中提供诸如引物、探针和/或包括校对聚合酶的其他试剂的工具,这有助于增加保存期。[0077]在另一相关方面,本发明还提供了用于根据本发明的方法检测msi生物标志物组中的插入缺失和/或用于处理根据本发明的试剂盒的自动化系统。[0078]在一个可能的实施方案中,这样的自动化系统可以包括与本发明的可重复使用的药筒兼容的控制台和仪器。该仪器包括用于执行测定法的控制模块。控制台是控制和监视测定法期间仪器的动作和药筒状态的计算机。测定法将优选地完全在药筒内部进行,并且可以包括例如实时pcr。在将样品插入如上所述的预先装有试剂的本发明的药筒中之后,将药筒装入仪器中,并且仪器控制在药筒中自动执行的测定法。运行测定法后,控制台软件处理结果并生成报告,供自动化系统的最终用户访问。[0079]自动化系统可以是开放或封闭的自动化系统。在将样品添加或插入药筒后,将药筒装进系统,然后将其关闭并在系统运行期间保持关闭状态。封闭的系统在板上包含所有必需的试剂,因此封闭的配置提供了系统执行无污染检测的优点。备选地,可以在自动化系统中使用开放的可访问药筒。根据需要,将必需的试剂添加到打开的药筒中,然后将样品插入打开的药筒中,并且可以在封闭的自动化系统中运行药筒。[0080]优选地,使用包含一个或多个反应腔室和一个或多个流体腔室的基于药筒的系统。一些流体腔室可以容纳用于从样品产生裂解物的流体。其他腔室可以容纳流体,例如反应缓冲液、洗涤液和扩增溶液。反应腔室用于执行检测的不同步骤,例如洗涤、裂解和扩增。[0081]在根据上述实施方案的一个特别期望的实施方案中,为简化和促进对根据本发明的方法的结果的解释,对熔解曲线的分析还通过计算机实现的方法方式以自动化方式执行。[0082]最后,本发明的目的还在于提供根据本发明的生物标志物组、方法、试剂盒包括药筒和自动化系统在分析肿瘤样品或预期包含肿瘤物质的生物学样品中的msi基因座中的用途。[0083]在一个优选的实施方式中,肿瘤是结肠直肠癌(colorectalcancer,crc)。在一个替代实施方案中,肿瘤是卵巢癌或子宫内膜癌。在又另一个实施方案中,肿瘤是胃癌。[0084]在一个可能的实施方案中,本发明还提供了根据本发明的生物标志物组、方法、试剂盒包括药筒和自动化系统在分析肿瘤样品中的msi基因座和基于该分析而预测肿瘤样品所衍生自的受试者对免疫疗法的应答中的用途。可以参考文献(特别是turajlic等人,2017年,lancetoncology)的最新报告来设想后一种用途,其中显示基因组中插入缺失的积累增加与编码大量新抗原序列的新开放阅读框的生成有关。与此相符,我们继续证明检测到在本发明的生物标志物组中至少2或3个插入缺失与每个样品评分的插入缺失和新抗原的总数密切相关。我们的数据进一步表明,可以通过本发明的方法和/或试剂盒预测肿瘤的独特的免疫原性表型。出于以下原因,后者非常有前途。免疫检查点阻断最近被批准用于治疗不可切除或转移性、微卫星不稳定性高(msi-h)的肿瘤,无论其部位或组织学如何。观察到的应答率约是40%。当前,没有fda批准的测试用于检测msi状态。msi-h肿瘤共享组织病理学特征,例如高淋巴细胞浸润和高肿瘤突变负荷。特别地,这些肿瘤具有大量的插入-缺失(indel)突变,已知其是高度免疫原性的,导致大量的新抗原。从我们的发现中可以得出,具有高插入缺失率的msi-h肿瘤将可能对使用靶向免疫检查点分子(例如pd-1、pd-l1或pd-l2)的抗体的免疫疗法具有高度应答性。因此,在另一个可能的实施方案中,提供了分析根据本发明的msi基因座的方法,其包括使用所获得的关于同聚物重复的数量的信息,以便决定对获得生物学样品的人进行免疫疗法的步骤。在可能的实施方案中,所述方法可以包括使用所获得的关于同聚物重复的数量的信息来推导肿瘤突变负荷或肿瘤插入缺失负荷的步骤。在所述方法的一个优选的实施方案中,推导的肿瘤突变负荷或肿瘤插入缺失负荷提供为对突变的总数量的估计,或提供为得分。在一个特定的实施方案中,本发明的方法可以包括使用所获得的关于同聚物重复的数量、或肿瘤突变负荷、或肿瘤插入缺失负荷、或对突变的总数量的估计、或分数的信息,以决定对获得生物学样品的人进行免疫疗法的步骤。如上所述,在这种方法的优选的实施方案中,免疫疗法包括用免疫检查点因子靶向抗体的治疗,所述抗体最优选地是对以下任何靶标具有特异性的抗体:pd-1,pd-l1或pd-l2。在另一方面,我们的数据还表明带有高新抗原的肿瘤也将通过嵌合抗原t细胞或治疗性疫苗疗法对特异性靶向所生成的新抗原的方法有反应性。因此,也可以设想实现所述手段的本发明方法的可能实施方案。本发明在受试者的诊断、预后和临床随访中的这些和其他用途对于本领域技术人员而言将是更容易衍生的。实施例1.用高度敏感的标志物的新集合检测癌症样品中的微卫星不稳定性(microsatelliteinstability,msi)[0085]从标志物的任何给定集合中衍生出4个标志物的最小集合都是不容易的。例如,zhao等人,2014年,elife描述的,使用59个标志物的组对18个msi-h样品的sequenom分析揭示了平均在44.26%的样品中标志物被称为突变体。尽管这一大组标志物在检测msi状态方面具有很高的性能,但从中衍生的4个所选标志物的随机集合与本文提出的包括acrv2a、dido1、mre11、sulf2的核心集合相比,其理论性能要差得多。这种随机选择的组另外地容易遭受这样的缺点,即它们可能包含在同聚物区域中显示出种族依赖性差异的标志物,例如对于加勒比亚人群而言对标志物tmem65所观察到的。这种差异使得设计出强健且性能优异的低数量标志物组极为困难,因为它们可能损害对msi驱动的改变的正确解释。当调用少量的可变标志物和/或缺乏适当的对照时,后者变得尤为重要,这在通常情况下是常见的,例如,msi生物标志物的经典贝塞斯达集合具有广泛的个体变异范围和多个变异等位基因,特别是在非洲人群中(buhard等,2006)。crc、胃癌和子宫内膜癌的msi谱分析[0086]在128个msi-h结肠直肠癌样品中对7个微卫星标志物(btbd7、ryr3、sec31a、acvr2a、dido1、mre11和sulf2)的状态进行了谱分析。包括几个临床地点和不同种族,以评估标志物选择的强健性。此外,在15个msi-h胃癌样品和19个msi-h子宫内膜癌样品中检查了7个标志物的状态。通过pcr在ffpedna上确定重复长度,然后用分子信标表征扩增产物。材料和方法[0087]样品。总共128个人msi-hcrcffpe样品获自不同来源,包括剑桥大学,lnstitutoportuguesdeoncologiadoporto,cureline,bocabiolistics,trans-hit,geneticistinc,righshospitalet,origene和asterand。15个人msi-h胃样品获自cureline和trans-hit,19个人msi-h子宫内膜样品获自idibell。[0088]样品处理。将每个msi-hffpe样品插入biocartisidyllatm专用的流体药筒中。将药筒封闭并加载到idyllatm平台上,以进行自动化的基于pcr的遗传分析,然后启动全自动样品处理。简而言之,根据biocartisffpe液化方案从ffpe样品中释放dna,然后根据标准idyllatm方案将其泵入药筒的pcr隔室中。[0089]pcr。对药筒的pcr隔室加载以便对于每个引物对或引物对双链体含有以下pcr混合物,如下所示:如下所示:如下所示:每个标志物的引物对和探针的序列如下:pcr条件如下:[0090]扩增子熔解。将pcr产物在药筒中于92℃变性2分钟。然后,通过以0.3℃(每循环12s)的步率将混合物从40℃加热至76.6℃并同时在每升高0.3℃后监测荧光信号,以收集熔解曲线荧光数据。[0091]后处理。在数据分析的第一步中,从idyllatm仪器中提取熔解曲线的原始荧光测量值。在接下来的步骤中,从测量值的向量中保留仅前64个周期。该子集被称为“感兴趣区域”或roi,因为在此窗口中观察到了最重要的信号变化。在以后的周期中,大多数观察到信标熔解。后处理算法的下一步是将离散小波变换(discretewavelettransform,dwt)应用于测量向量(roi)。小波特别适合分析融解曲线,因为这是在特定温度区域中发生的低频现象。小波能够同时执行时间和频率分析。这意味着它们可以就低频变化而言解释正在发生的事情以及发生的时间。这样的小波紧凑地概括了熔解曲线过程。在这种特定情况下,使用db8小波,并保留第三级系数。在此变换之后,缩放系数和小波系数都被保留,从而得到8个系数的两个集合。对于测定法中存在的每个标志物,计算16个小波系数的一个集合。每个标志物的该小波系数集合称为每个标志物的后处理结果。[0092]决策树。熔解曲线数据的数据分析的第二步称为决策树。在此步骤中,应用模式识别算法以便基于后处理结果对有效样品进行分类。为此,将作为神经网络的分类算法应用于每个标志物的后处理结果。该网络已使用已知输入基因型的标记的数据进行了训练。对于参考数据,此标记基于报告的输入基因型。对于临床数据,此标记是通过熔解曲线专家从熔解谱的视觉评分获得的。通过神经网络中权重的迭代优化,算法可以学习区分野生型(wt)和突变体曲线。算法给出概率得分作为每个标志物基因的输出,以反映决策的确定性(对于突变体为1,对于wt为0)。如果至少两个标志物的概率得分高于0.5,则将样品评分为msi-h。结果1.crc中的msi谱分析[0093]第一分析。对包括acvr2a、dido1、mre11和sulf2的四个标志物的核心集合评估了从128个msi-h样品库中恢复msi-h阳性样品的能力。当后处理的熔解曲线数据的决策树导致至少两个标志物被检测为包含插入缺失时,样品被评分为阳性。使用四个标志物的核心集合,可以将96%的样品鉴定为msi-h。由于已定义了最低可接受性能为恢复至少95%的样品,因此上述选择已被接受为msi标志物的核心集合。[0094]为了创建对这些标志物性能的进一步评估,对来自4个的核心组的3个标志物的所有可能排列进行了相同的性能分析。结果表明,对于每个可能的子选择,性能都更差,范围从83%到93%。为了提供测定法跨癌症类型的更强健性,优选具有至少四个标志物的设计。[0095]第二分析。通过将另外的标志物(btbd7)添加到四个标志物的核心集合中,可以将多一个样品评分为msi-h,占正确评分样品的97%,从而使组更有效地定义msi状态。[0096]第三分析。通过将另外的标志物(sec31a)添加到五个标志物集合中,可以将测试的有限样品集合中的所有样品评分为msi-h,从而提供了进一步的改进。[0097]第四分析。通过将另外的标志物(ryr3)添加到六个标志物的集合中,自然地,所有样品仍被评分为msi-h。尽管从当前数据中无法立即看到,但从理论上讲,在分析更大的样品集的情况下,添加第7个标志物很可能仍会提高测定法的性能。从理论上讲,鉴于在msi-h样品中观察到的这些标志物的突变频率,对于7个标志物,假阴性率预计低至~1/1900,这对于更大的样品集合可能是有意义的。[0098]crc样品分析的结果如图1所示。2.在胃癌和子宫内膜癌中的msi谱分析[0099]第一分析。然后,在34个癌症样品的库中评估了四个表现最佳的crc标志物(acvr2a、dido1、mre11和sulf2)的核心集合,其中包括15个胃癌样品和19个子宫内膜(en)癌症样品。结果表明与其他癌症类型相比,acvr2a中的同聚物重复是crc中更有效的标志物。然而,尽管样品库很小,但胃癌和en癌中核心集合的结果却非常接近95%的可接受阈值,这很好地指示在较大的样品库中,本文提出的核心4标志物集合通常可以用于其他mmr缺乏或微卫星不稳定的肿瘤类型,而不仅限于crc。为了更好地了解核心组性能,必须对更多的样品进行谱分析。[0100]第二分析。通过将另外的标志物(btbd7)添加到四个标志物的核心集合中,可以将多一个样品评分为msi-h,在这个小样品集合中,这五个标志物组的性能已达到97%正确评分样品的高度满意值。[0101]第三分析。通过将另外的标志物(sec31a)添加到五个标志物集合,可以将所有样品评分为msi-h。3.通过idyllatmmsi测试的手段对7个标志物的自动msi谱分析[0102]背景:已建议对所有患有结肠直肠癌(crc)的患者进行微卫星不稳定性(msi)的检测。当前的临床参考方法是对错配修复蛋白的免疫组织化学染色和/或对dna的频繁突变的短串联重复区域的pcr分析。idyllatmmsi测试是使用短同聚物的新集合开发的,以无偏好的方式选自整个外显子组序列数据(zhao等,2014;elife),与当前方法相比,能够以更高的特异性和选择性进行更快的检测。[0103]方法:原型idyllatmmsi测试药筒开发到最终设计。使用这些原型测试,在348个福尔马林固定和石蜡包埋(ffpe)的crc样品上确定了7个生物标志物的新集合的重复长度,其允许完整的自动化工作流程,包括样品制备,dna扩增,其后的熔解曲线分析和自动解释。患者样品的几个临床部位和不同种族包括在内,以评估标志物选择的强健性。此外,还使用用于msi检测的参考方法(promegamsi分析系统)对所有样品进行了筛选。[0104]结果:分别通过idyllatm和promega,一百二十七(36.5%)和116(33.3%)个样品分类为高msi(msi-h),并且209(60.1%)和220(57.3%)个样品分类为微卫星稳定(mss),而这两种方法均无法对12个样品(3.4%)进行分类。一致性分析揭示总体一致率为96.1%(93.4%-97.7%95%ci)。通过idyllatm,14个为msi-h,但通过promega为mss(11个)或无效(3个);在idyllatm上中位数是3/7阳性标志物。[0105]结论:该研究验证了新的msi生物标志物在大量不同集合的crc样品上区分msi-h与mss状态。它还证明了用于msi测试的全自动分析的可能性。原型idyllatmmsi测试与完全集成的idyllatm平台兼容,从仅一个ffpe肿瘤切片(无需参考样品)在150分钟内即可提供准确可靠的结果。一般结论[0106]本文提出的仅四个核心标志物的组在acvr2a、dido1、mre11和sulf2基因中包括同聚物重复,在crc样品中显示了非常好的性能。甚至即使我们得到并且只对其中的很少进行谱分析,它在胃癌和子宫内膜癌样品中也表现出非常好的性能。对除crc以外来源的更多msi-h样品进行谱分析将可能证实两种标志物的最小核心组对更广谱的癌症的适用性。当前,看来acvr2a基因中的同聚物是用于crc的特别有效的和非常特异的msi标志物。因此,在其他癌症类型中,作为本发明的替代实施方案,可能提出并测试其他最小核心组。从本文提供的初步数据来看,似乎可以提出以下三个核心4个标志物组:(1)dido1、sulf2、btbd7和sec31a;(2)dido1、sulf2、btbd7和acvr2a;(3)dido1、sulf2、sec31a和ryr3。不管mmr缺陷样品的类型如何,包含acvr2a、dido1、mre11、sulf2和btbd7的核心5标志物组显示出普遍适用于诊断不同来源的样品,并因此构成本发明的特别有吸引力的实施方案。2.用于检测msi的7个同聚物插入缺失的新集合与子宫内膜癌和结肠直肠癌的肿瘤突变负荷和总插入缺失负荷相关[0107]背景:免疫检查点阻断最近被批准用于治疗不可切除或转移性的、高微卫星不稳定性(microsatellite-instability-high,msi-h)的肿瘤,而不论部位或组织学如何。观察到的应答率是~40%。当前,没有fda批准的检测msi状态的测试。msi-h肿瘤共有组织病理学特征,例如高淋巴细胞浸润和高肿瘤突变负荷。特别地,这些肿瘤具有大量的插入-缺失(indel)突变,与单核苷酸变体相反,已知其引起移码并因此导致了高度免疫原性的大量新抗原。因此,msi-h肿瘤中的高插入缺失率可能预示了对抗pd1疗法的应答。[0108]方法。我们选择了msi和mss肿瘤,这些肿瘤的全外显子测序数据可从我们先前的报道中获得(zhao等人,elife2014)。这些包括来自子宫内膜癌的11个msi样品,来自结肠直肠癌的22个msi样品和89个mss样品。然后,我们根据全外显子组测序数据确定了针对取代和插入缺失而分层的突变负荷。扩增了本文所述的七个标志物,并在illuminahiseq4000上进行了基于配对末端扩增子的测序。以5.000x的最小覆盖率和87.000x的平均覆盖率对扩增子测序。mss样品用于计算带有缺失的读数的平均百分比。当突变读数的百分比大于6个sd时(对应于p值《1.0e-5),认为标志物是阳性的。由于同聚物区域中的聚合酶滑移,一些标志物具有高的突变体背景率。这介于6.6%(对于acvr2a)到36.0%(对于btbd7)之间。[0109]结果。由于技术上的困难(图5a所示),19个msi-h肿瘤对最初筛选的6个插入缺失中至少有2个呈阳性(如图5a所示),然后全部7个(图5b所示)插入缺失呈阳性,而mss肿瘤对它们中没有一个呈阳性。此外,我们将所有可用的msi-h肿瘤(n=19+14)中阳性插入缺失的数量与突变负荷相关联。这揭示了非同义和插入缺失突变负荷均呈正相关(全部7个插入缺失相关的值分别为:r=0.68p《6.5e-05和r=0.75p《2e-16)。每增加一个阳性插入缺失标志物,我们观察到119个插入缺失中插入缺失突变率的增加,开始于3个标志物阳性的中位数为~250个插入缺失。结果示于附图3-6中。[0110]结论。选择7个插入缺失能够可靠地检测子宫内膜癌和结肠直肠癌中的msi-h,而阳性插入缺失的数量作为肿瘤突变负荷和肿瘤总插入缺失负荷的指标,并因此可以用作肿瘤新抗原负荷预测msi-h肿瘤中对抗pd-1疗法的应答的检测。这7个标志物将作为全自动的idyllatmmsi测试来检测msi状态,并可以作为辅助诊断剂来预测msi-h肿瘤的免疫疗法结果。3.与idyllatmmsi测试和ihc分析的有效、无效、错误和不一致结果相关的crc肿瘤分期概述[0111]材料。该研究是从两家大学医院,universityhospitalaarhus(地点1)和universityhospitalantwerp(地点2)通过常规诊断获得的330份残留ffpe样品上执行的。样品来自crc患者,并且代表了crc的所有阶段,包括i期。msiihc数据从两个研究地点获得,并基于组织学ffpe切片的护理标准(soc)ihc测试结果(回顾性病理数据)。两个地点都使用包含7个本文所述的标志物的idyllatmmsi测试执行msi测试。在两个地点的场所分别对150个和180个样品的集合执行测试。为了提供信息,执行了idyllatmmsi测试与组织学msi免疫组织化学(ihc)数据之间的一致性。在330个样品中,分期信息不适用于16个样品(参见图7中的表格)并且是基于病理报告中可用的数据。在某些情况下,肿瘤、淋巴结和转移(tnm)分期(根据美国癌症、结肠癌和直肠癌分期联合委员会第7版)仅由于每个病理报告的来源有限,从t和n参数得出。在目前的研究人群中,6.7%(n=22)、19.4%(n=64)、43.3%(n=143)和25.8%(n=85)分别是i期、ii期、iii期和iv期,如图7第一栏中所示。[0112]方法。使用biocartis专有的基于药筒式和平台idyllatm,以自动化方式在ffpe样品执行idyllatmmsi测试。将ffpe样品插入包含上述试剂的单个药筒中,然后根据上述方案通过自动平台操作和分析这些药筒。然后,将idyllatmmsi测试获得的结果与通过ihc评价的对ffpe样品的msi状态评估并列。通过使用基于贝塞斯达组的promegamsianalysissystemv1.2,根据制造商验证的方案,进行交叉测试,确认了两个ffpe样品的无效结果。[0113]结果。idyllatmmsi测试与历史性的免疫组织化学(ihc)msi数据之间的比较仅供参考,并如图7所示。结果显示,在330个总样本中,只有两个在idyllatmmsi测试中评分为无效,并且测试是强健的,因为在330次执行的运行中均未遇到任何错误。这两个样品的测试无效可能是由于它们的质量差,由promegamsianalysissystemv1.2也未能分析所述样品(数据未显示)证实了这一点。结果总体上显示了idyllatmmsi测试与ihc结果之间具有良好的一致性。重要的是,与ihc结果一致,idyllatmmsi测试还正确地鉴定了i期crc的两个样品中的msi-h表型。这证明了为了鉴定早期msi-h肿瘤,不是非要在蛋白质水平上测试mmr途径中是否存在病变,而是还可以在dna水平上检测微卫星不稳定性标志。[0114]结论。结果证实了根据本发明的msi分析方法的强健性,并首次为我们提供了临床证明,即分子msi标志测试可以正确地鉴定i期crc中的msih状态。这表明该测试也很有可能在其他i期癌症类型中也能够正确地鉴定msi-h状态。定义[0115]如本文所用,术语“生物学样品”或简称为“样品”旨在包括含有核酸和/或细胞材料的各种生物学来源,无论其是否是从生物体新鲜获得的(即新鲜组织样品)或通过本领域已知的任何方法保存的(例如冷冻或ffpe样品)。生物学样品的实例包括:细胞的培养物,例如哺乳动物细胞,还包括真核微生物,体液,体液沉淀物,灌洗样本,细针抽吸物,活检样品,组织样品,癌细胞,从患者获得的其他类型的细胞,来自组织的细胞或来自被测试和/或治疗疾病或感染的个体的体外培养细胞,或法医样品。体液样品的非限制性实例包括全血,骨髓,脑脊液(csf),腹膜液,胸膜液,淋巴液,血清,血浆,尿液,乳糜,大便,射出的精液,痰,乳头抽吸液,唾液,拭子标本,洗涤或灌洗液和/或刷子样本。[0116]如本文所用,术语“核酸”及其等同的“多核苷酸”是指通过核苷酸单体之间的磷酸二酯键结合在一起的核糖核苷酸或脱氧核糖核苷酸的聚合物。(脱氧)核苷酸是(脱氧)核苷的磷酸化形式,其最通常包括腺苷、鸟苷、胞苷、胸苷或尿苷。这些核苷由戊糖(核糖或脱氧核糖)和含氮碱基(“核碱基”,或简称为“碱基”,其为腺嘌呤、鸟嘌呤(是嘌呤)、胞嘧啶、胸腺嘧啶或尿嘧啶(是嘧啶))组成。这些碱基(或它们的核苷,或后者的核苷酸)在核酸链中排列的序列称为“核酸序列”,并通常按所谓的5'末端至3'末端方向提供,指示核酸链的化学方向。“5'”起源于第一个(脱氧)核糖环的5'碳,核酸序列的读取在此开始,“3'”起源于最后一个(脱氧)核糖环的3'碳,核酸序列的读取在此结束。核酸序列可以例如是atatgcc,在本文中应解释为是指5'-atatgcc-3'核酸序列。根据相同的约定,后一个序列将与序列5'–ggcatat–3',或简称ggcatat互补。核酸序列可以是同聚物重复序列,即由包含相同含氮碱基的一定数量的连续核苷酸组成的序列,其在本文中也称为“同核苷酸”。例如,术语“包含8个连续腺嘌呤的同聚物重复”应解释为是指核酸的至少一部分,所述部分由包含8个连续核苷酸的串组成,其中每个所述核苷酸包含腺嘌呤作为含氮碱基。此类序列将被命名为5'-aaaaaaaa-3'(或简称aaaaaaaa),而其互补序列是5'-tttttttt-3'(或tttttttt)。术语“同聚物重复的突变形式”或“其突变形式”在本文中应理解为是指给定同聚物重复的msi变体,其包含至少一个同源核苷酸的插入或缺失(即“插入缺失”)。例如,包含8个连续腺嘌呤的同聚物重复的突变形式可以是包含7个连续腺嘌呤的同聚物重复,或包含9个连续腺嘌呤的同聚物重复。核酸包括但不限于dna和rna,包括基因组dna、线粒体或medna、cdna、mrna、rrna、trna、hnrna、microrna、lncrna、sirna及其各种修饰形式。核酸最通常可以从天然来源获得,例如从不同类型的生物获得的生物学样品。另一方面,核酸也可以以任何已知的人设计的方法(例如pcr)合成、重组或以其他方式产生。[0117]术语“定量pcr”或简称“qpcr”在本文中给出了基于聚合酶链式反应(pcr)的一种实验室技术的定义,其用于扩增并同时检测或定量靶向的dna分子。与反应产物是在其末端进行检测(即在热循环完成之后)的标准pcr相反,qpcr的关键特征是随着反应“实时”进行,在热循环期间检测dna产物;因此,qpcr的替代名称为“实时pcr”。当前存在许多不同类型的qpcr。例如,当从逆转录(rt)步骤开始时,qpcr可以用于定量信使rna的数量,并因此称为逆转录酶qpcr或rt-qpcr。如本文所用,术语“定量pcr”或简称“qpcr”将优先于术语“实时pcr”或“rt-pcr”使用,以避免与反转录pcr(也经常缩写为rt-pcr)混淆。大多数qpcr使用两种最常用方法之一来实时检测产物扩增:(a)将非特异性荧光染料插入任何双链dna,或(2)由用仅在探针与其互补靶序列杂交后才允许检测的荧光报告子标记的寡核苷酸组成的序列特异性dna探针。在热循环过程中生成的荧光信号由适当的光学检测系统检测,并从它们通过背景阈值的那一刻开始跟踪直到反应达到平台。可以使用相对或绝对定量策略来估计靶序列的拷贝数,通常通过分析获得的扩增曲线的形状(标准曲线策略)或通过确定信号何时升高到某个阈值以上(通常称为ct值,但有时也称为cp值或cq值)。在相对定量中,使用ct或标准曲线分析在给定样品中估计的靶核酸水平表示为相对于另一参考样品(例如未处理的对照样品)中相同靶标获得的值。相反,在绝对定量中,qpcr信号与使用标准曲线的输入拷贝数有关,或者也可以根据最新的数字pcr方法进行计算。目前,第一种策略仍然更加流行并且基于通过将获得的值与先前制作的标准曲线进行比较来估计靶dna量。这些和其他qpcr定量策略在本领域广为人知,并且根据给定的应用程序和qpcr系统,它们的计算可以或大或小地不同。[0118]如本文所用,术语“用于执行定量pcr的手段”应理解为用于执行qpcr的试剂和元件的最小必需布置。它们将通常将包括允许从核酸源收到的核酸模板在实时pcr热循环中检测的任何试剂。这样的试剂包括但取决于qpcr的类型而不限于pcr级聚合酶、至少一个引物集合、可检测的染料或探针、dntp、pcr缓冲液等。此外,“用于执行定量pcr的手段”将通常还包括本领域中已知的任何标准的部件最少组装,其通常包括但不限于以下:(1)合适的隔室(还称为“热循环qpcr隔室”),其中可以发生实时可检测的热循环。这样的隔室可以例如由适于扩增核酸的腔室形成,即由合适的材料制成并提供足够的内部温度调节,并且还包括至少一个壁以允许实时检测在这种扩增期间产生的信号,例如对光透明的壁。此外,(2)用于改变该腔室或其他隔室中的温度的手段,如从各种现有的热循环机中众所周知的。然后,(3)用于检测在qpcr热循环期间生成的信号的手段,例如与计算机耦合的光学检测器等。简而言之,这种最小的组装将通常包括本领域已知的任何能够启动和维持在热循环qpcr隔室中的热循环反应,调整和调节温度以确保其中稳定的热循环条件等的系统。此外,它将还包括任何适当的检测装置,数据处理的手段(例如,备选地与数据库连接的计算机)和允许实时读取和监视qpcr反应的热循环的输出系统(通常是在适当的图形用户界面中显示反应进度的计算机屏幕)。另外,它将还包含适合于操作机器和/或显示并可能帮助解释所获得结果的任何软件包。[0119]如本文所用,术语“药筒”应理解为腔室和/或通道的独立组件,其形成为单个物体,可以作为一个配件在适用于接受或连接到这种药筒的更大仪器的内部或外部转移或移动。包含在药筒中的一些部分可以牢固地连接,而其他部分可以相对于药筒的其他组件灵活地连接和移动。类似地,如本文所用,术语“流体药筒”应理解为包括至少一个适合于处理、加工、排放或分析流体,优选地液体的腔室或通道的药筒。在wo2007004103中给出了这种药筒的实例。有利地,流体药筒可以是微流体药筒。在流体药筒的上下文中,术语“下游”和“上游”可以定义为与流体在这种药筒中流动的方向有关。即,流体从药筒中的流体路径的一部分流向同一药筒中的第二部分,前者部分被解释为位于后者的上游。类似地,流体较晚到达的部分相对于所述流体较早通过的部分位于下游。[0120]通常,如本文中所使用的,术语“流体的”或有时是“微流体的”是指处理在至少一个或两个维度(例如,宽度和高度或通道)在几何上被约束到小的通常为亚毫米级的流体的行为、控制和操纵的系统和布置。这种小体积的流体以需要小尺寸和低能耗的小尺度移动、混合、分离或以其他方式处理。微流体系统包括诸如微气动系统(压力源、液体泵、微阀等)的结构以及用于处理微、纳和皮升体积的微流体结构(微流体通道等)。在ep1896180、ep1904234和ep2419705中描述了示例性的流体系统,并因此可以将其应用于本文提出的本发明的某些实施方案中。[0121]如本文所使用,术语“dwt”指离散小波变换(discretewavelettransform);术语“dwt系数”指离散小波变换系数(discretewavelettransformcoefficient)。小波变换表示使用程序或子例程对原始数据进行的计算。因此,dwt系数的集合是经过小波变换的值的集合。核酸分析中最相关的dwt系数是那些捕获实验的重要事件的系数,例如,在双链核酸分子的熔解实验中,最相关的dwt系数可以是原始数据融解曲线中的峰或峰移动。[0122]如本文所使用的,术语熔解曲线原始数据、原始数据熔解曲线和原始熔解曲线数据是等同的并且可互换使用。它们指在核酸解离或缔合实验后获得的标识符。当前第1页12当前第1页12