染色体构象划分产物捕获的制作方法
【专利说明】染色体构象划分产物捕获
[0001] 相关申请的交叉引用
[0002] 本申请要求于2014年2月13日提交的美国临时申请61/939,565号的优先权,该文 的全部内容通过引用纳入本文用于所有目的。
【背景技术】
[0003] 用于研究染色体体内构象的技术已经掲示了大量关于基因调控机制的信息。例 如,染色体构象研究可掲示通过远程DNA序列元件对基因的远程调控。一种用于确定染色体 的体内构象的广泛使用的方法被称为染色体构象捕获,或3C。其它技术延伸3CW提供其它 信息或能够进行更高通量的分析。运类技术包括,例如,伯、5(:、6(:、化-(:、化1?-环和化1八-PET。
[0004] -般而言,染色体构象捕获技术包括固定染色质的Ξ维组织的交联步骤、内切核 酸酶消化步骤、连接步骤和生成核酸分子文库的反交联步骤。该文库含有核酸分子,其中由 于交联事件之前的Ξ维染色质结构而邻近的序列元件在反交联事件之后在一级结构水平 上邻近。然后可采用各种扩增、测序或其它核酸检测方法来鉴定Ξ维空间上邻近的序列元 件。
[000引连接步骤可能需要广泛优化W提供合适的核酸分子文库。例如,连接交联的元件 使得它们存在于同一核酸分子上的分子内连接事件一般有利。相反,不交联的序列元件连 接的分子间连接事件一般需要避免或最小化。作为另一个示例,确保在反交联之后没有发 生连接是重要的。作为另一个示例,不充分的连接可能产生提供很少信息的分子文库。
【发明内容】
[0006] 本申请提供了使用划分产物进行染色体构象捕获的改进方法。在一些情况中,该 方法不需要连接步骤。在一些情况中,该方法改善了连接步骤的效率、完成度或保真性或其 组合。
[0007] 在一些实施方式中,本发明提供了一种检测在细胞或完整核中相近的染色体DNA 序列元件的方法,包括:a)交联细胞或完整核中的染色体DNA,从而形成交联的DNA产物,其 中在细胞中相近的染色体DNA序列交联;b)得到交联的DNA产物;C)用内切核酸酶消化交联 的DNA产物W形成含多种交联的DNA消化片段的混合物;d)划分交联的DNA消化片段W产生 多个划分产物;并且e)检测单个划分产物中就基因组的一级序列而言彼此远离的2个或更 多个DNA序列元件的存在,其中在单个划分产物中检测到2个或更多个DNA序列元件表明所 述2个或更多个DNA序列在细胞或完整核中相近。
[0008] 在一些实施方式中,本发明提供了一种检测在细胞或完整核中相近的核酸序列元 件的方法,包括:a)交联细胞或完整核中的染色体DNA,从而形成交联的DNA产物,其中在细 胞中相近的核酸序列交联;b)得到交联的DNA产物;C)用内切核酸酶消化交联的DNA产物W 形成含多种交联的DNA消化片段的混合物;d)划分交联的DNA消化片段W产生多个划分产 物;并且f)检测单个划分产物中就基因组的一级序列而言彼此远离的2个或更多个核酸序 列元件的存在,其中在单个划分产物中检测到2个或更多个核酸序列元件表明所述2个或更 多个核酸序列在细胞或完整核中相近。
[0009] 在一些方面中,划分交联的DNA消化片段,使得各划分产物中交联的DNA消化片段 的平均数量为约1或更低。在一些情况中,划分交联的DNA消化片段W产生多个划分产物包 括产生至少1000、至少10000、至少20000、至少100000、或至少1000000个划分产物。在一些 情况中,划分产物在体积上小于约10化L、小于约10化或小于约InL。
[0010] 在一些方面中,该方法还包括反交联,从而从划分产物中交联的DM消化片段中生 成2个反交联的DNA消化片段。在一些情况中,在消化交联的DNA的步骤之后进行反交联。
[0011] 在一些方面中,检测包括检测划分产物中反交联的DNA消化片段,其中在单个划分 产物中检测到2个反交联的DNA消化片段表明运2个反交联的DNA消化片段曾交联,由此检测 到在核中相近的染色体DNA序列元件。在一些情况中,反交联包括将划分产物加热至至少约 55°C、至少约65°C、或至少约95°C。在一些情况中,反交联包括用蛋白酶,如蛋白酶K解育划 分产物。
[001引在一些方面中,检测包括检测划分产物中反交联的同时含有DNA和RNA的DNA消化 片段,其中在单个划分产物中检巧蝴2个反交联的DNA消化片段表明运2个反交联的DNA消化 片段曾交联,由此检测在核中相近的DNA和/或RNA序列元件。在一些情况中,反交联包括将 划分产物加热至至少约55°C、至少约65°C、或至少约95°C。在一些情况中,反交联包括用蛋 白酶,如蛋白酶K解育划分产物。在一些情况中,检测包括逆转录。
[0013]在一些方面中,多个划分产物中的全部、几乎全部或一部分含有核酸条码。在一些 情况中,核酸条码连接到固体支持物。
[0014] 在一些方面中,检测包括DM扩增。在一些情况中,DNA扩增包括PCR。在一些情况 中,DNA扩增包括祀向基因座扩增(TLA)。在一些情况中,DNA扩增包括逆转录或RT-PCR。在任 意前述的实施方式、方面或情况中,检测步骤可包括核酸测序。
[0015] 在一些方面中,交联完整核中的染色体DNA包括用交联剂解育细胞。在一些方面 中,交联完整核中的染色体DNA包括用交联剂解育完整核。
[0016] 在一些实施方式中,可在多个完整核或含完整核的多个细胞上进行任意前述方 法。在一些情况中,该方法还包括对2个或更多个核酸(例如,DNA)序列元件的交联频率进行 定量,从而对运2个或更多个核酸(例如,DNA)序列元件在完整核群中相近的频率进行定量。
[0017] 在一些实施方式中,本发明提供了包含划分产物的组合物,所述划分产物含有交 联的DNA消化片段。在一些实施方式中,本发明提供了包含划分产物的组合物,所述划分产 物含有交联的DNA消化片段,该消化片段含有DNA和RNA。在一些实施方式中,本发明提供了 包含划分产物的组合物,所述划分产物含有反交联的DNA消化片段,其中反交联的DNA消化 片段是下述过程的产物:交联完整核中DNA、用核酸内切酶消化DNA、形成含有消化的和交联 的DNA的划分产物并反交联。在一些方面中,划分产物含有反交联的DNA消化片段和反交联 的RNA或cDNA。在一些方面中,划分产物还包含DNA扩增试剂或核酸测序试剂。在一些情况 中,DNA扩增试剂或核酸测序试剂包含寡核巧酸引物或DNA聚合酶。在一些情况中,组合物还 包含至少1000、至少10000、至少20000、或至少100000个划分产物。在一些情况中,划分产物 在体积上小于约10化L、小于约10化或小于约InL。
[001引在一些情况中,检测划分产物中2个或更多个核酸(例如,DNA、cDNA或RNA)序列元 件的存在可包括检测各虚拟划分产物中的运类元件。例如,检测到2个或更多个具有相同条 码的核酸序列元件可表示运2个或更多个核酸序列元件位于相同的划分产物中并因此在细 胞或完整核中相近。替代地,划分产物中的检测可指检测物理划分产物。
【附图说明】
[0019] 图1显示了进行基于划分产物的染色体捕获分析的方法的几个实施方式。
[0020] 图2显示了进行基于划分产物的染色体捕获分析的方法的一个实施方式。在该实 施方式中,双链衔接子寡核巧酸偶联到固体支持物颗粒上并被划分。衔接子寡核巧酸可含 有对各固体支持物颗粒独特的条码。衔接子寡核巧酸也可含有用于测序和/或扩增的一个 或多个限制性位点和引物结合位点。可用限制性酶消化交联的DNA划分产物并且划分成条 码化的划分产物。可用限制性酶(例如,热稳定限制性酶)消化衔接子寡核巧酸W生成与交 联的DNA片段的一个或多个末端相容并连接到交联的DNA片段的粘性末端。可合并划分产 物,并且DNA片段任选地去交联并扩增W生成扩增子。然后可对扩增子进行测序W分析染色 体构象。
[0021] 图3显示了进行基于划分产物的染色体捕获分析的方法的一个实施方式。在该实 施方式中,单链引物寡核巧酸与固体支持物颗粒偶联或整合到凝胶支持物颗粒中并被划 分。该引物寡核巧酸可含有对于各固体支持物颗粒独特的条码,和可与交联的DNA杂交的杂 交区。杂交区域可W是,例如所示的随机六聚体。可用限制性酶消化交联的DNA划分产物并 且划分成条码化的划分产物。可通过例如加热溶解固体或凝胶支持物。交联的DNA可去交联 并通过来自单链引物寡核巧酸的随机引物扩增来生成扩增子。然后划分产物可被合并。然 后可对扩增子进行测序W分析染色体构象。
[0022] 图4显示了进行基于划分产物的染色体捕获分析的方法的几个实施方式。在该实 施方式中,交联的DNA被划分,并且在一个或多个下游加工步骤中将额外的试剂注射到划分 产物中。
[0023] 定义
[0024] 除非另外定义,本文中使用的所有技术和科学术语具有本领域普通技术人员通常 所理解的同样含义。参见例如Lackie,DICTIONARY OF CELLAND MOLECULAR BI0L0GY(《细胞 和分子生物学词典》),埃尔斯威尔出版社化Isevier)(第4版2007);Sambrook等,MOLECULAR 化0NING,A LABORATORY MANUAL(《分子克隆,实验室手册》),冷泉港实验室出版社(冷泉港, 纽约1989)。术语"一个"或"一种"意在表示"一个(种)或多个(种Γ。当术语"包含"及其各种 变体例如"包括"和"含有"位于叙述步骤或要素之前的时候,是用来表示添加其它的步骤或 要素是任选的,并且是非排它性的。本发明的实践中可W使用与本文所述类似或等价的任 何方法、装置和材料。本文提供的定义是用来帮助理解本文经常用到的某些术语,不对本发 明的范围构成限制。
[002引本文所用术语"划分"或"划分的"指将样品分为多个部分或"划分产物"。划分产物 可W是固体或流体。在一些实施方式中,划分产物是固体划分产物,例如微通道。在一些实 施方式中,划分产物是流体划分产物,例如液滴。在一些实施方式中,流体划分产物(如液 滴)是不互溶的流体(如水和油)的混合物,或乳液。在一些实施方式中,流体划分产物(如液 滴)是水性液滴,其被不互溶的运载体流体(如油)包围。在其它实施方式中,液体划分产物 是与相邻水性液滴在物理或化学上分开的水性液滴,使得一个液滴的内容物不会扩散到相 邻液滴中。
[0026] 术语"探针"指与目标分子特异性相互作用或特异性结合目标分子的分子(例如蛋 白质、核酸、适体等)。与目标分子特异性相互作用或特异性结合目标分子的分子的非限制 性示例包括核酸(如寡核巧酸)、蛋白质(如抗体、转录因子、锋指蛋白、非抗体蛋白支架等) 和适体。
[0027] 术语"染色体"是指细菌或真核染色体。
[0028] 本文所用的染色体结构包括一级、二级、Ξ级和四级结构。一级染色体结构,或一 级结构是指染色体的核巧酸序列。二级结构可W指较高水平的结构组织,如双链DNA的双螺 旋结构,与核小体结合的双链染色体DNA的11-nm纤维(例如,一串上的珠子),或层叠和折叠 的11-nm纤维的30-nm纤维。Ξ级结构是指将30-nm纤维折叠成环、转角、假结、结构域或其它 Ξ级结构元件。在一些情况中,Ξ级染色体结构可使在染色体的一级序列中彼此远离的DNA 序列元件相近。四级结构是指2个或更多个不同的染色体的分子间组织。在一些情况中,四 级染色体结构可使在物理上不相连的DNA序列元件相近。本文所用术语"染色质"用于指代 与蛋白质或其它核酸结合的一个或多个染色体。例如,染色质可与组蛋白、转录因子、抑制 因子、增强子、聚合酶、修复酶、甲基化酶、去甲基化酶、非编码RNA分子等结合。本文所用术 语"染色体"涵盖染色质。
[0029] 用于核中2个核酸序列元件之间的距离时,术语"邻近"是指在Ξ维空间中运2个核 酸序列元件之间的距离。如此,染色体中在一级序列上接近(例如,在约10、50、100、150、 200、或25化P或更多W内)的DNA序列元件总是彼此相近。在一些情况中,在染色体的一级序 列中彼此远离(例如,隔开超过约200、250、300、400、500、1000、1500、2000、5000、10000、 25000、50000、100000、250000、500000 或 lOOOOOObp)的 DNA序列元件可能由于染色体的 Ξ 级 或四级结构而彼此相近。在一些