本公开文本涉及用于分析聚合大分子(包括诸如肽、多肽和蛋白质的聚合大分子)的物质组合物、方法和系统。
背景技术:
1、蛋白质是细胞功能的基础。因此,每个细胞内数千种蛋白质的序列及其浓度是细胞健康的关键指标。蛋白质的序列或浓度异常可能指示疾病状态。然而,目前缺乏用于对蛋白质组进行灵敏、准确、经济且无偏差的表征的工具和技术。异常序列和/或浓度的早期检测对于许多疾病例如癌症的诊断和治疗至关重要。由于这些和其他原因,应该开发更好的工具来评价生物样品中蛋白质和肽的序列和浓度。
2、一旦此类工具可用,新的生物标记物的发现、即使最低丰度蛋白质的浓度的准确确定、重要的翻译后修饰的发现以及对蛋白质组动态的监测就成为改善医疗保健的一些最初步骤。用于对癌症和其他健康病症的重要特征进行更深入理解和更早检测的这些初始步骤将允许在最早阶段作出诊断,促进治疗发现,并通过告知治疗过程对患者护理产生有益影响。
3、因此,本领域需要用于高度并行化、准确、灵敏且高通量的蛋白质组学分析的物质组合物、方法和系统。本公开文本解决了此需求和其他需求。
技术实现思路
1、本公开文本涉及用于以高度平行和高通量的方式经由将聚合大分子(包括肽、多肽和蛋白质)的序列重新编码为dna聚合物来分析这些聚合大分子的物质组合物、方法和系统。
2、在一些实施方案中,本文公开了用于确定与固体支持物偶联的肽的氨基酸残基的身份和位置信息的方法,所述方法包括:(a)向所述固体支持物提供所述肽,所述肽与所述固体支持物偶联,使得所述肽的n末端氨基酸残基不直接与所述固体支持物偶联并且暴露于反应条件;(b)提供化学反应性缀合物,所述化学反应性缀合物包含:(x)包含与循环数相关的循环核酸的循环标签,(y)用于结合所述肽的n末端氨基酸残基的反应性部分,和(z)用于固定到所述固体支持物上的固定部分;(c)使所述肽与所述化学反应性缀合物接触,从而使所述化学反应性缀合物与所述肽的n末端氨基酸偶联以形成缀合复合物;(d)经由所述固定部分将所述缀合复合物固定到所述固体支持物上;(e)从所述肽切割且由此分离所述n末端氨基酸残基,从而提供固定的氨基酸复合物,所述固定的氨基酸复合物包含所述切割并分离的n末端氨基酸残基;(f)使所述固定的氨基酸复合物与结合剂接触,所述结合剂包含:用于优先结合所述固定的氨基酸复合物的结合部分和包含与所述结合剂对应的重新编码核酸的重新编码标签,从而形成亲和复合物,所述亲和复合物包含固定的氨基酸复合物和所述结合剂,从而使所述循环标签与所述亲和复合物内的所述重新编码标签接近;(g)将所述重新编码核酸的信息转移至所述固定的缀合复合物的循环核酸以产生重新编码块;(j)获得所述重新编码块的序列信息;以及(k)基于所述获得的序列信息,确定所述肽的氨基酸残基的身份和位置信息。在一些实施方案中,从所述肽切割所述n末端氨基酸残基暴露下一个氨基酸残基作为所述切割的肽上的n末端氨基酸残基。在一些实施方案中,所述化学反应性缀合物的反应性部分从所述肽切割所述n末端氨基酸残基。一些实施方案包括对所述肽的每个随后的氨基酸重复步骤(b)至(k)。一些实施方案包括在所述使所述固定的氨基酸复合物与结合剂接触之前,洗涤所述固定的氨基酸复合物。一些实施方案包括基于所述序列信息确定所述肽的可能的三维结构。在一些实施方案中,所述重新编码核酸包括dna或rna。在一些实施方案中,所述循环核酸包括dna或rna。在一些实施方案中,获得所述重新编码块的序列信息包括进行测序。在一些实施方案中,所述结合部分包括肽、抗体、抗体片段或抗体衍生物。在一些实施方案中,所述结合部分包括适配体。在一些实施方案中,所述结合部分结合天然氨基酸、翻译后修饰的氨基酸、氨基酸的衍生形式、翻译后修饰的氨基酸的衍生或稳定形式、合成氨基酸、具有特定侧链的氨基酸、具有磷酸化侧链的氨基酸、具有糖基化侧链的氨基酸、具有甲基化修饰的氨基酸或d-氨基酸,或结合它们的组合。在一些实施方案中,所述固体支持物包括珠、板或芯片。在一些实施方案中,所述固体支持物包括玻璃载玻片、二氧化硅、树脂、凝胶、膜、聚苯乙烯、金属、硝酸纤维素、矿物、塑料、聚丙烯酰胺、胶乳或陶瓷。在一些实施方案中,所述肽包括激素、神经递质、酶、抗体、病毒蛋白、细菌蛋白、合成肽、生物活性肽、肽激素、寡肽、多肽、融合蛋白、环肽、分支肽、重组蛋白、肿瘤标记物、治疗性肽、抗原性肽或信号传导肽。在一些实施方案中,所述肽源自细胞裂解物、血液样品、血浆样品、血清样品、组织活检物、唾液样品、尿液样品、脑脊液样品、汗液样品、滑液样品、粪便样品、肠道微生物组样品、环境水样品、土壤样品、细菌培养物、病毒培养物、类器官、肿瘤活检物、痰样品或毛发样品。在一些实施方案中,所述肽与疾病相关。在一些实施方案中,所述转移信息包括进行核酸扩增、酶连接、夹板连接、化学连接、模板辅助连接、连接酶的使用、夹板寡核苷酸的使用、催化剂的使用、桥接分子的使用、缩合剂的使用、偶联剂的使用、聚合酶的使用、互补核酸序列的使用、切口酶的使用、核酸修饰酶的使用、重组酶的使用、链置换聚合酶的使用、单链结合蛋白的使用、点击化学反应、磷酸二酯键形成或肽核酸介导的连接。在一些实施方案中,所述重新编码核酸的信息包含所述重新编码核酸的序列或所述重新编码核酸的序列的反向互补体。在一些实施方案中,所述转移信息包括将所述重新编码核酸或所述重新编码核酸的反向互补体与所述循环核酸接合。
3、在一些实施方案中,本文公开了用于确定肽的多个氨基酸残基的身份和位置信息的方法,所述肽包含n个氨基酸残基,所述方法包括:(a)将所述肽与固体支持物偶联,使得所述肽的n末端氨基酸残基不直接与所述固体支持物偶联并且暴露于反应条件;(b)提供化学反应性缀合物,所述化学反应性缀合物包含:(x)包含与循环数相关的循环核酸的循环标签,(y)反应性部分,所述反应性部分用于结合并切割所述肽的n末端氨基酸残基并暴露下一个氨基酸残基作为所述切割的肽上的n末端氨基酸残基,和(z)用于固定到所述固体支持物上的固定部分;(c)使所述肽与所述化学反应性缀合物接触,从而使所述化学反应性缀合物与所述肽的n末端氨基酸偶联以形成缀合复合物;(d)经由所述固定部分将所述缀合复合物固定到所述固体支持物上;(e)从所述肽切割且由此分离所述n末端氨基酸残基,从而暴露所述下一个氨基酸残基作为所述切割的肽上的n末端氨基酸残基并提供固定的氨基酸复合物,所述固定的氨基酸复合物包含所述切割并分离的n末端氨基酸残基;(f)将(b)至(e)重复n-1次以组装n-1个另外的固定的氨基酸复合物,每个另外的固定的氨基酸复合物相应地包含与循环2至n相关的核酸;(g)使所述固定的氨基酸复合物与结合剂接触,所述结合剂包含:用于优先结合一种所述固定的氨基酸复合物或所述固定的氨基酸复合物的子集的结合部分和包含与所述结合剂对应的重新编码核酸的重新编码标签,从而形成一个或多个亲和复合物,每个亲和复合物包含固定的氨基酸复合物和所述结合剂,从而使循环标签与每个形成的亲和复合物内的重新编码标签接近;(h)在每个形成的亲和复合物内,将循环标签或其反向互补体接合到重新编码标签以形成重新编码块,从而产生多个重新编码块,每个重新编码块与形成的亲和复合物对应;(i)接合所述多个重新编码块的两个或更多个成员以形成记忆寡核苷酸;(j)获得所述记忆寡核苷酸的序列信息;以及(k)基于所述获得的序列信息,确定所述肽的多个氨基酸残基的身份和位置信息。在一些实施方案中,将(g)-(h)重复2、3、4次或更多次。在一些实施方案中,n是大于或等于2的整数。在一些实施方案中,每种结合剂包含具有唯一核酸序列的重新编码标签。在一些实施方案中,多种结合剂包含具有相同核酸序列的重新编码标签。在一些实施方案中,所述结合剂包含具有唯一序列部分和共同序列部分的重新编码标签。一些实施方案包括在(f)与(g)之间将所述循环标签去保护。一些实施方案包括在所述使所述固定的氨基酸复合物与结合剂接触之前,洗涤所述固定的氨基酸复合物。一些实施方案包括基于所述序列信息确定所述肽的可能的三维结构。在一些实施方案中,所述重新编码核酸包括dna。在一些实施方案中,所述循环核酸包括dna。包括获得所述记忆寡核苷酸的序列信息的一些实施方案包括进行测序。在一些实施方案中,所述结合部分包括抗体或其片段。在一些实施方案中,所述结合部分结合天然氨基酸、衍生氨基酸、合成氨基酸或d-氨基酸。在一些实施方案中,所述结合部分结合翻译后修饰的氨基酸。在一些实施方案中,所述固体支持物包括珠、板或芯片。在一些实施方案中,所述固体支持物包括玻璃载玻片、二氧化硅、树脂、凝胶、膜、聚苯乙烯、金属、硝酸纤维素、矿物、塑料、聚丙烯酰胺、胶乳或陶瓷。在一些实施方案中,确定所述肽的多个氨基酸残基的身份和位置信息包括确定所述肽的所有氨基酸残基的身份和位置信息。在一些实施方案中,确定所述肽的多个氨基酸残基的身份和位置信息包括仅确定所述肽的氨基酸残基子集的身份和位置信息。一些实施方案包括通过将所述多个氨基酸残基的身份和位置信息与数据库进行比较来鉴定所述肽。
4、在一些实施方案中,本文公开了化学反应性缀合物(crc),所述化学反应性缀合物包含:(a)核酸序列标签;(b)用于结合并切割肽的n末端氨基酸残基的反应性部分;和(c)用于固定到固体支持物上的固定部分。一些实施方案包括由式i表示的crc:
5、
6、其中a包含所述循环标签,b包含所述反应性部分,c包含所述固定部分,la包含任选的接头,lb包含任选的接头,并且lc包含任选的接头。一些实施方案涉及式i的crc,其中a包含循环标签,b包含反应性部分,c包含固定部分,la包含任选的接头,lb包含任选的接头,并且lc包含任选的接头。可以是或包括中心部分。一些实施方案包括由式ii表示的crc:
7、
8、其中a包含所述循环标签,b包含所述反应性部分,c包含所述固定部分,lab包含任选的接头,并且lbc包含任选的接头。一些实施方案涉及式ii的crc,其中a包含循环标签,b包含反应性部分,c包含固定部分,lab包含任选的接头,并且lbc包含任选的接头。在一些实施方案中,所述反应性部分包括异硫氰酸苯酯(pitc)、异硫氰酸酯(itc)、丹磺酰氯、二硝基氟苯(dnfb)、酶或肽、或其组合或衍生物。在一些实施方案中,所述反应性部分在特定氨基酸处特异性切割。在一些实施方案中,所述反应性部分切割多于单个氨基酸或基序。在一些实施方案中,所述固定部分包括生物素、链霉亲和素、硫醇基团、胺基或羧基、叠氮化物、炔烃、烯烃、芳基硼酸、芳基卤、卤代炔烃、甲硅烷基炔烃、si-h基团、受保护或光保护的反应性基团、或光激活的反应性基团。在一些实施方案中,所述核酸序列标签在将所述核酸序列与用于附接核酸序列的基团缀合后产生,所述基团包括羟基胺基、四嗪、叠氮化物、炔烃、烯烃、反式环辛烯、dbco、双环壬炔、降冰片烯、应变炔烃或应变烯烃、或其衍生物。在一些实施方案中,通过将所述反应性部分附接至所述crc上用于附接所述反应性部分的基团来产生所述反应性部分,所述基团包括四嗪、叠氮化物、烯烃、炔烃、反式环辛烯、dbco、双环壬炔、降冰片烯、应变炔烃或应变烯烃、或其衍生物。一些实施方案包括在(a)与(b)之间、(b)与(c)之间、(a)与(c)之间、(a)与(b+c)之间、(b)与(a+c)之间、或(c)与(a+b)之间或其任何组合的可切割基团。一些实施方案包括在(a)与(b)之间、(b)与(c)之间或其组合的可切割基团。在一些实施方案中,(a)、(b)和(c)按以下任何顺序相对于彼此线性定向:(a)-(b)-(c)、(a)-(c)-(b)、或(b)-(a)-(c)。
9、在一些实施方案中,本文公开了用于确定肽的氨基酸残基的身份和位置信息的试剂盒,所述试剂盒包含:化学反应性缀合物,所述化学反应性缀合物包含(a)核酸序列标签和(b)反应性部分,所述反应性部分与肽的n末端氨基酸残基偶联,由此形成缀合复合物,所述缀合复合物包含与所述肽的n末端氨基酸偶联的所述化学反应性缀合物;结合剂,所述结合剂包含用于优先结合所述缀合复合物的结合部分和含有与所述结合剂对应的重新编码核酸的重新编码标签;和用于将所述重新编码核酸的信息转移至所述缀合复合物的循环核酸以产生重新编码块的试剂。
10、在一些实施方案中,本文公开了用于对寡核苷酸的核苷酸子集进行测序的方法,所述方法包括:在核酸测序反应中提供可逆终止的核苷酸和非可逆终止的核苷酸的组合,其中不对所测序核酸中与所述非可逆终止的核苷酸对应的核苷酸进行测序。一些实施方案包括鉴定所测序核酸中与所述可逆终止的核苷酸对应的核苷酸。在一些实施方案中,所测序核酸包含仅包括选自a、c、g和t的核苷酸的子集的区域,并且其中不对所述核苷酸的子集进行测序。在一些实施方案中,选自a、c、g和t的所述核苷酸的子集包含选自a、c、g和t的2种核苷酸。在一些实施方案中,选自a、c、g和t的所述核苷酸的子集包含选自a、c、g和t的3种核苷酸。在一些实施方案中,所述区域包含引物序列。在一些实施方案中,所述区域不包含条形码序列、重新编码核酸序列或其部分、或循环核酸序列或其部分。
11、在一些实施方案中,本文公开了方法,所述方法包括:提供缀合物,所述缀合物包含与受保护的寡核苷酸偶联的反应性分子;使所述反应性部分与肽的末端氨基酸接触,从而使所述反应性部分与所述末端氨基酸结合,并且任选地从所述肽切割所述末端氨基酸;使所述寡核苷酸去保护;以及使所述去保护的寡核苷酸与用于连接或聚合的酶或试剂接触。一些实施方案包括重新保护所述寡核苷酸。在一些实施方案中,所述反应性部分从所述肽切割所述末端氨基酸以暴露下一个末端氨基酸,并且其中所述方法进一步包括在重新保护所述寡核苷酸后使所述下一个氨基酸与另一个所述缀合物接触。在一些实施方案中,所述末端氨基酸是n末端氨基酸。在一些实施方案中,将所述肽固定至固体支持物。在一些实施方案中,所述缀合物包含有机小分子。在一些实施方案中,所述缀合物包括化学反应性缀合物(crc),所述化学反应性缀合物包含:(a)所述寡核苷酸;(b)所述反应性部分;和(c)固定部分。在一些实施方案中,所述寡核苷酸包含循环核酸。
12、在一些实施方案中,本文公开了方法,所述方法包括:提供缀合物,所述缀合物包含与受保护的寡核苷酸偶联的肽;接触所述肽的末端氨基酸,从而使反应性部分与所述末端氨基酸结合,并且任选地从所述肽切割所述末端氨基酸;使所述寡核苷酸去保护;以及使所述去保护的寡核苷酸与用于连接或聚合的酶或试剂接触。一些实施方案包括重新保护所述寡核苷酸。在一些实施方案中,所述反应性部分从所述肽切割所述末端氨基酸以暴露下一个末端氨基酸,并且其中所述方法进一步包括在重新保护所述寡核苷酸后使所述下一个氨基酸与另一个所述缀合物接触。在一些实施方案中,所述末端氨基酸是n末端氨基酸。在一些实施方案中,将所述肽固定至固体支持物。在一些实施方案中,所述缀合物包含有机小分子。
13、提供此
技术实现要素:
以便以简化的形式介绍概念的选择,且将在下文具体实施方式中进一步加以描述。此发明内容既不意图确定要求保护的主题的关键或基本特征,也不意图用于限制要求保护的主题的范围。根据下文书面具体实施方式将清楚要求保护的主题的其他特征、细节、效用和优点,所述具体实施方式包括在附图中示出并在所附权利要求中限定的那些方面。本公开文本的这些方面以及其他特征和优点更详细地描述于下文中。