使用单分子检测的分子分析物的数字分析的制作方法
【专利说明】
[0001] 夺叉引用到相关申请
[0002] 本申请要求美国临时申请号61/869, 020的权益。出于所有目的,上述申请的全部 教导通过引用并入本文。
[0003] 背景
技术领域
[0004] 本公开内容涉及诊断和通讯理论领域,并具体涉及用于分子分析物的数字化分析 的方法。
[0005] 相关领域描沐
[0006] 多种分子的和生物化学的方法可用于分子分析物识别和定量。实例包括常用的基 于核酸的试验,例如qPCR(定量聚合酶链式反应)和DNA微阵列,和基于蛋白的方法,例如 免疫测定和质谱。然而,目前的分析物分析技术中存在各种各样的限制。例如,目前的方法 具有灵敏度的限制,特别是当分析物以低拷贝数或者低浓度存在于生物样品中的时候。为 了获得更高的灵敏度,大多数核酸定量技术包括样品的扩增。然而,扩增技术向定量中引入 了偏差和不准确度。而且,扩增对于蛋白质和肽是不可能的。由于缺乏灵敏度,用于检测和 定量的方法经常要求相对大的样品量。目前的方法还在识别和定量大量分析物的能力方面 受到限制。样品中的全部mRNA和蛋白质的定量要求高的多复杂度(multiplexity)和大的 动态范围。另外,目前的技术缺乏同时检测和定量核酸与蛋白质的能力。
[0007] 由于例如弱信号检测,假阳性和其它错误的状况,目前的方法经常在分析物检测 与定量过程中产生误差(error)。这些误差可能导致分析物的错误识别和不准确的定量。
[0008] 因此,需要用于分析物分析的方法和系统,其具有高灵敏度(样品量小的时候)、 高多复杂度、大动态范围且能够在单次试验中检测蛋白质和核酸分子。更重要的是,需要用 于校正分析物检测误差的误差校正方法。本发明通过使用数字化读出器引入生物分析物的 灵敏的单分子识别和定量解决了现有技术的这些以及其它限制。
[0009] 附图简要说明
[0010] 公开的实施方式具有其它优势和特征,所述优势和特征从以下本发明的详细说明 书和所附权利要求与所附附图结合时来看将更明显,其中:
[0011] 图1是根据本发明的一个实施方式说明计算机实例的系统结构框图。
[0012] 图2A说明了根据本发明的一个实施方式的包含抗体和可检测标签的探针实例, 其中所述探针与靶蛋白结合。
[0013] 图2B说明了根据本发明的一个实施方式的包含第一抗体和与可检测标签缀合的 第二抗体的探针实例。
[0014] 图3示出了根据本发明的一个实施方式的结合至包含适体和尾区的探针的靶分 析物。
[0015] 图4示出了根据本发明的一个实施方式的连接至包含适体和尾区的探针的荧光 标签。
[0016] 图5示出了根据本发明的一个实施方式的包含连接至可与尾区杂交的区域的抗 体的探针实例。
[0017] 图6说明了根据本发明的一个实施方式的包含第一抗体和缀合至尾区的第二抗 体的探针实例。
[0018] 图7示出了根据本发明的一个实施方式的与包含分析物(例如蛋白质、DNA和/或 RNA)的样品结合的固体基底实例。
[0019] 图8示出了根据本发明的一个实施方式的用于结合分析物的实例基底(10x10阵 列)。
[0020] 图9是根据本发明的一个实施方式的固体基底的俯视图,其具有与所述基底随机 结合的分析物。
[0021] 图10A-10D说明了排列在基底上的十六种靶蛋白实例。图IOB和IOC描述了根据 本发明的一个实施方式的与不同探针池接触后的基底图像实例。
[0022] 图11说明了根据本发明的一个实施方式的里德-所罗门误差校正结构实例。
[0023] 图12A说明了根据本发明的一个实施方式的基底实例,其分为三个描述靶分析物 浓度水平的区域。
[0024] 图12B-12C示出了根据本发明的一个实施方式的靶分析物丰度范围图。
[0025] 图13说明了根据本发明的一个实施方式使用单色荧光标签、单通过、计数的暗 (dark counted)和每周期1比特且使用基底和四种分析物的实例检测试验。
[0026] 图14示出了根据本发明的一个实施方式使用单色荧光标签、每周期四个通过、不 计数的暗周期和每周期2比特且使用基底和四种分析物的实例检测试验。
[0027] 图15示出了根据本发明的一个实施方式的用于靶分析物的颜色序列和ID,并示 出了用于加探针、结合和剥离周期的靶分析物的扫描结果。
[0028] 图16A示出了根据本发明的一个实施方式的在基底不同部分识别出的特定靶分 析物的数量。
[0029] 图16B示出了根据本发明的一个实施方式的用于靶分析物的颜色序列和ID。
[0030] 图17是根据本发明的一个实施方式的与结合至基底的靶分析物杂交的单个荧光 体探针的图像。
[0031] 图18示出了根据本发明的一个实施方式的使用单个荧光体检测识别不同靶分析 物的实例。
[0032] 图19示出了根据本发明的一个实施方式的用于两个靶分析物的颜色序列和ID, 并示出了用于加探针、结合和剥离周期的靶分析物的扫描结果。
[0033] 图20是根据本发明的一个实施方式的结合到基底并与缀合的抗体杂交的单分子 肽的图像。
[0034] 图21示出了根据本发明的一个实施方式的来自UniProt数据库的蛋白质估计浓 度概率图。
[0035] 图22示出了根据本发明的一个实施方式的基底不同丰度区域的估计值列表。
[0036] 图23是根据本发明的一个实施方式的穿过任何丰度范围的蛋白质识别模拟图。
[0037] 图24说明了根据本发明的一个实施方式的用于识别靶分析物的系统误差率对原 始误差率的图。
【发明内容】
[0038] 本发明涉及用于检测多个分析物的系统和方法,包括:获得多个有序探针试剂组, 每个有序探针试剂组包含针对N个不同靶分析物的确定子集的一种或多种探针,其中将N 个不同靶分析物固定在基底的空间上分离的区域,且每个探针被可检测地标记。方法还包 括进行至少M个探针结合和信号检测的周期的步骤,每个周期包含一个或多个通过,其中 每个通过包括使用至少一个有序探针试剂组。方法包括从至少M个周期检测是否存在来自 基底的空间上分离的区域的多个信号。
[0039] 方法包括对于N个不同靶分析物中的一个或多个,从多个信号确定每周期至少K 比特的信息,其中使用至少K比特的信息来确定L总比特的信息,其中K X M = L比特的信 息且L>log2 (N),且其中使用L比特信息来确定是否存在N个不同靶分析物中的一个或多 个。
[0040] 在一些实施方式中,L>log2(N),且L包含用于靶识别的比特的信息。在其它其它 实施方式中,L>log2 (N),且L包含以预定顺序排序的比特信息。
[0041] 在一个实施方式中,预定顺序是随机顺序。在另一个实施方式中,L>log2 (N),且L 包含包括解码多个有序探针试剂组的顺序的密匙的比特信息。
[0042] 本方法还包括数字化多个信号以扩展多个信号检测的动态范围。在一些实施方式 中,至少K比特信息包含关于周期中的通过数量的信息。在另一个实施方式中,至少K比特 信息包含关于N个不同靶分析物中的一个的信号不存在的信息。
[0043] 在一个实施方式中,可检测标记物是荧光标记物。在另一个实施方式中,探针包含 抗体。在一个实施方式中,抗体直接与标记物缀合。抗体还可结合到与标记物缀合的第二 抗体。在其它其它实施方式中,探针包含适体。在一个实施方式中,适体包含同聚碱基区。 在其它其它实施方式中,多个分析物包含蛋白质、肽适体或核酸分子。
[0044] 本方法可包括从至少M个周期检测是否存在多个光学信号。本方法还可包括从至 少M个周期检测是否存在多个电信号。
[0045] 在一个实施方式中,本方法是计算机执行的。在另一个实施方式中,K是每周期一 比特的信息。在其它其它实施方式中,K是每周期两比特的信息。K还可以是每周期三或更 多比特的信息。
[0046] 在另一个实施方式中,本方法包括从L比特的信息确定用于多个输出信号的误差 校正。误差校正方法可以是里德-所罗门编码。
[0047] 在一个实施方式中,本方法包括基于N个不同靶分析物的数量来确定有序探针试 剂组的数量。本方法还可包括基于N个不同靶分析物的类型来确定探针试剂组的类型。
[0048] 在实施方式中,N个不同靶分析物存在于样品中,其被分为多个等分部分,并被稀 释为多个不同最终稀释物,将多个等分部分的每一个固定在基底的不同部分。在另一个实 施方式中,基于N个不同靶分析物中的至少一个的可能自然存在的浓度来确定不同最终稀 释物中的一个。在另一个实施方式中,通过计数靶分析物在不同部分中的一个内的出现次 数来确定N个不同靶分析物中的一个的浓度,并根据各个等分部分的稀释物来校准计数。
[0049] 本发明包括用于检测多个分析物的试剂盒,包含:多个有序探针试剂组,每个有序 探针试剂组包含针对N个不同靶分析物的确定子集的一种或多种探针,其中将N个不同靶 分析物固定在基底的空间上分离的区域,且每个探针被可检测地标记。试剂盒包括基于多 个可检测信号来检测N个不同分析物的说明。试剂盒包括进行至少M个探针结合和信号检 测的周期的说明,每个周期包含一个或多个通过,其中每个通过包括使用至少一个有序探 针试剂组。试剂盒包括从至少M个周期检测是否存在来自基底的空间上分离的区域的多个 信号的说明。试剂盒还包括对于N个不同靶分析物中的一个或多个,从多个信号确定每周 期至少K比特的信息,其中使用至少K比特的信息来测定L总比特的信息,其中K X M = L 比特的信息且L>log2 (N),且其中使用L比特的信息来确定是否存在N个不同靶分析物中的 一个或多个。
[0050] 在一些实施方式中,试剂盒包括一个或多个包含抗体的探针。在其它其它实施方 式中,标记物是荧光标记物。在另一个实施方式中,探针是抗体。在一个实施方式中,抗体 直接与标记物缀合。在又一个实施方式中,抗体结合至与标记物缀合的第二抗体。在其它 其它实施方式中,探针包含适体。适体包含同聚碱基区。在一些实施方式中,多个分析物包 含蛋白质、肽适体或核酸分子。
[0051] 在其它实施方式中,L>log2(N)。在另一个实施方式中,N。试剂盒还可包括使 用L比特的信息确定N个不同靶分析物中的每一个的识别的说明,其中L包含用于靶识别 的比特信息。
[0052] 试剂盒可包括使用L比特信息确定多个有序探针试剂组的顺序的说明,其中L包 含以预定顺序排序的比特信息。预定顺序可以是随机顺序。试剂盒还可包括使用用于解码 多个有序探针试剂组的顺序的密匙的说明。
[0053] 发明详沐
[0054] 附图和以下描述仅以说明的方式涉及本发明的不同实施方式。应注意从以下讨论 将容易认识到在本文中公开的结构和方法的可替代实施方式是可行的替代方案,其可以被 实施而不背离要求保护的内容的原理。
[0055] 现将详细提及多个实施方式,其实例以所附【附图说明】。注意只要可行,相似或相同 的参考数字可在图中使用并可表明相似或相同的功能。附图仅出于说明的目的而描述公开 的系统(或方法)的实施方式。本领域技术人员从以下描述容易认识到在本文中说明的结 构和方法的可替代实施方式可以被实施而不背离在本文中描述的原理。
[0056] 定义
[0057] "靶分析物"或"分析物"是指待识别、待定量以及待以其它方式表征的分子、化合 物、物质或组分。靶分析物可包含例如但不限于原子、化合物、(任意分子大小的)分子、多 肽、(折叠或未折叠的)蛋白质、寡核苷酸分子(RNA、cDNA或DNA)、其片段、其修饰的分子, 例如修饰的核酸、或其组合。在实施方式中,靶分析物多肽或蛋白质为约9个氨基酸长度。 一般来说,革G分析物可以以任意宽范围的浓度(例如,从mg/ml至ag/ml范围)在任意体积 (例如,低至皮升范围)的溶液中。例如,血液、血清、福尔马林固定石蜡包埋(FFPE)的组 织、唾液、或尿样品可以含有各种靶分析物。靶分析物由探针识别出,探针使用电学或光学 检测方法用于识别和定量靶分析物。
[0058] 靶蛋白的修饰例如可以包括翻译后修饰,例如将其它其它生物化学官能团(例 如乙酸盐、磷酸盐、各种脂类和碳水化合物)连接至蛋白质、改变氨基酸的化学性质(例 如瓜氨酸化)或进行结构改变(例如形成二硫键)。翻译后修饰的实例还包括但不限于 为膜定位而增加疏水基团(例如豆蔻酰化、棕榈酰化)、为增强酶活性而增加辅因子(例 如Iipolyation)、翻译因子的修饰(例如形成白喉酰胺)、增加化学基团(例如酰化、烷基 化、形成酰胺键、糖基化、氧化)、糖修饰(糖化)、增加其它其它蛋白质或肽(遍在蛋白化 (ubiquination))或改变氨基酸的化学结构(例如脱酰胺化、氨甲酰化)。
[0059] 在其它其它实施方式中,靶分析物是被修饰的寡核苷酸。DNA修饰的实例包括DNA 甲基化和组蛋白修饰。
[0060] 本文所使用的"探针"是指能够与其它分子(例如包含DNA或RNA的寡核苷酸、多 肽或全长蛋白质等)、细胞组分或结构(脂类、细胞壁等)或细胞结合用于检测或评价所述 分子、细胞组分或结构、或细胞的性质的分子。探针包含结合到靶分析物的结构或组分。在 一些实施方式中,多个探针可识别相同靶分析物的不同部分。探针实例包括但不限于适体、 抗体、多肽、寡核苷酸(DNA、RNA)或其组合。作为探针的抗体、适体、寡核苷酸序列及其组合 还在下文中详细描述。
[0061] 探针可包含用于检测靶分析物存在的标签(tag)。标签可直接或间接结合到、杂 交到、缀合到或共价连接到靶分析物的结合组分。在一些实施方式中,所述标签是可检测标 记物,例如荧光分子或化学发光分子。在其它实施方式中,所述标签包含具有同聚碱基区 (homopolymeric base region)(例如聚A尾)的核苷酸序列。探针可经由标签电学检测 出、光学检测出或化学检测出。
[0062] 本文中所用的术语"标签"是指能够检测靶分析物的分子。标签可以是具有同聚 碱基区(例如聚A尾区)的核苷酸序列。在其它实施方式中,标签是标记物,例如荧光标记 物。标签可以包含但不限于荧光分子、化学发光分子、生色团、酶、酶底物、酶辅因子、酶抑制 剂、染料、金属离子、金属溶胶、配体(例如生物素、抗生物素蛋白、链霉抗生物素蛋白或半 抗原)、放射性同位素等。标签可直接或间接结合到、杂交到、缀合到或共价连接到探针。 [0063] "蛋白质"或"多肽"或"肽"是指具有两个或更多个氨基酸、氨基酸类似物或其它 拟肽(peptidomimetics)的分子。蛋白质可以是折叠的或是未折叠的(变性的)。多肽或 肽可以具有二级结构,例如α螺旋、β折叠或其它构象。本文中所用的术语"氨基酸"是指 天然和/或非天然或合成的氨基酸,包括甘氨酸和D或L光学异构体二者,和氨基酸类似物 和拟肽。肽可以是两个或更多个氨基酸长度。更长长度的肽通常称为多肽。蛋白质可以指 定义所包含的全长蛋白质、类似物及其片段。该术语还包括蛋白质或多肽的表达后修饰,例 如,糖基化、乙酰化、磷酸化等。而且,由于该分子中存在可电离的氨基和羧基基团,具体的 多肽可以以酸盐或碱盐或以中性形式获得。蛋白质或多肽可从原始有机体直接获得,或可 重组地或合成地生产。
[0064] 蛋白质可通过肽序列、侧链修饰和/或三级结构识别和表征。侧链修饰包括磷酸 化、乙酰化、糖化等。丝氨酸、苏氨酸和酪氨酸的羟基基团的磷酸化是特别重要的令人感兴 趣的修饰。
[0065] 术语"体内"是指在活的有机体中发生的过程。
[0066] 本文所使用的术语"哺乳动物"包括人类和非人类,并且包括但不限于人、非人的 灵长类、犬科、猫科、鼠科、牛科、马科和猪科。
[0067] 本文所使用的"样品"包括标本、培养物或来自生物材料的收集物。样品可源自或 取自哺乳动物,其包括但不限于人、猴子、大鼠或小鼠。样品可包括材料例如但不限于培养 物、血液、组织、福尔马林固定石蜡包埋(FFPE)的组织、唾液、毛发、排泄物、尿等。这些实例 不被解释为对可用于本发明的样品的类型的限制。
[0068]