转座酶可接近性染色质的单细胞分析的制作方法

文档序号:17214528发布日期:2019-03-27 11:09阅读:241来源:国知局
转座酶可接近性染色质的单细胞分析的制作方法
本申请要求2017年5月26日提交的美国临时专利申请第62/511,905号;2017年6月30日提交的美国临时专利申请第62/527,529号;和2018年3月29日提交的美国临时专利申请第62/650,223号的优先权,它们各自通过引用整体并入本文。
背景技术
:可以出于各种目的处理样品,例如鉴定样品内部分的样品类型。样品可以是生物样品。可以出于各种目的处理生物样品,例如检测疾病(例如癌症)或鉴定特定物质。有各种处理样品的方法,例如聚合酶链式反应(pcr)和测序。可以在各种反应环境(例如分配区(partition))内处理生物样品。分配区可以是孔或液滴。可以采用液滴或孔以使生物样品能够被分配和独立处理的方式处理生物样品。例如,这种液滴可以与其他液滴在流体上隔离,从而能够精确控制液滴中的各个环境。分配区中的生物样品可以经受各种过程,例如化学过程或物理过程。分配区中的样品可以经受加热或冷却,或化学反应,例如以产生可定性或定量处理的物质。某些应用可受益于从大得多的群体获得的单细胞获得的物质的扩增或测序。在某些情况下,感兴趣的单细胞可能是非常罕见的。技术实现要素:本公开提供了样品制备技术,其允许对来自感兴趣的单细胞的核酸进行测序。在真核基因组中,染色体dna自身缠绕在组蛋白蛋白(即“核小体”)上,从而形成称为染色质的复合物。染色质的紧密或松散包装有助于控制基因表达。紧密包装的染色质(“封闭的染色质”)通常不允许基因表达,而更松散包装的染色质的可接近区域(“开放染色质”)与基因产物的活性转录相关。用于探测全基因组dna可及性的方法已证明在多种细胞类型中鉴定调节元件和量化导致基因表达的激活或抑制的变化的方面是非常有效的。一种这样的方法是利用高通量测序的针对转座酶可接近性染色质的测定(atac-seq)。atac-seq方法使用人工转座子探测dna可接近性,人工转座子将特定序列插入到染色质的可接近区域中。因为转座酶只能将序列插入到未被转录因子和/或核小体结合的染色质的可接近区域中,所以测序读长可用于推断染色质可接近性增加的区域。atac-seq方法的传统方法需要大量细胞,批量处理细胞并且产生代表整个细胞群的数据,但缺乏关于细胞群中固有存在的细胞间变异的信息(参见,例如,buenrostro等,curr.protoc.mol.biol.,2015年1月5日;21.29.1–21.29.9)。虽然已开发出单细胞atac-seq(scatac-seq)方法,但它们受到若干限制。例如,利用样品汇集、细胞索引和细胞分选的scatac-seq方法(参见,例如,cusanovich,等,science,2015年5月22日;348(6237):910-14)导致高度变异性和与任何单细胞相关的少量读长。利用可编程微流体装置分离单细胞并在纳升反应室中执行scatac-seq(参见,例如,buenrostro,等,nature,2015年7月23日;523(7561):486-90)的其他scatac-seq方法受限于测定的通量,并且可能不在与临床决策相容的时间尺度上产生个体表观基因组谱。在一个方面中,本公开提供了一种用于核酸处理的方法,其包括:(a)产生包含以下的分配区:(i)包含染色质的生物颗粒,所述染色质包含模板核酸分子;(ii)包含共同条形码序列的多个核酸条形码分子;(iii)包含转座子末端序列的多个转座子末端核酸分子;和(iv)多个转座酶分子;(b)借助于转座酶-核酸复合物产生多个模板核酸片段,所述转座酶-核酸复合物包含多个转座酶分子中的转座酶分子和多个转座子末端寡核苷酸分子中的转座子末端寡核苷酸分子;以及(c)使用多个核酸条形码分子中的核酸条形码分子和多个模板核酸片段中的模板核酸片段产生条形码化核酸片段。在一些实施方案中,条形码化核酸片段通过将核酸条形码分子与模板核酸片段或其衍生物连接来产生。在一些实施方案中,条形码化核酸片段通过使用核酸条形码分子作为引物,扩增模板核酸片段或其衍生物来产生。在一些实施方案中,转座酶-核酸复合物使用多个转座酶分子中的转座酶分子和多个转座子末端核酸分子中的转座子末端核酸分子在分配区中产生。在一些实施方案中,将转座酶-核酸复合物分配到分配区中。在一些实施方案中,多个核酸条形码分子附接于珠粒,并且其中分配区还包括珠粒。在一些实施方案中,核酸条形码分子可释放地附接于珠粒。在一些实施方案中,所述方法还包括从珠粒释放多个核酸条形码分子。在一些实施方案中,珠粒是凝胶珠粒。在一些实施方案中,凝胶珠粒是可降解的凝胶珠粒。在一些实施方案中,可降解的凝胶珠粒在施加刺激时可降解。在一些实施方案中,刺激是化学刺激。在一些实施方案中,刺激是还原剂。在一些实施方案中,分配区还包括化学刺激。在一些实施方案中,在(b)之前,从生物颗粒释放模板核酸分子。在一些实施方案中,在(b)之后,从生物颗粒释放多个模板核酸片段。在一些实施方案中,生物颗粒是细胞。在一些实施方案中,生物颗粒是细胞核。在一些实施方案中,分配区是乳液中的水性液滴。在一些实施方案中,分配区是孔。在一些实施方案中,所述方法还包括从分配区释放或去除条形码化核酸片段或其衍生物。在一些实施方案中,所述方法还包括对条形码化核酸片段或其衍生物进行测序。在一些实施方案中,多个转座子末端核酸分子还包含与多个核酸条形码分子的序列互补的序列。在一些实施方案中,分配区还包含多个第二核酸分子,所述第二核酸分子包含转座子末端序列和引物序列,并且其中所述转座酶-核酸复合物包含:(i)多个转座酶分子中的转座酶分子;(ii)多个转座子末端寡核苷酸分子中的转座子末端寡核苷酸分子;和(iii)多个第二核酸分子中的第二核酸分子。在一些实施方案中,多个核酸条形码分子是部分双链的并且包含(i)包含共同条形码序列和与多个第一核酸分子的序列互补的序列的第一链;和(ii)包含与共同条形码序列互补的序列的第二链。在一些实施方案中,多个核酸条形码分子是单链的并且包含共同条形码序列和与多个转座子末端核酸分子中的序列互补的序列。在一些实施方案中,生物颗粒还包含模板核糖核酸(rna)分子,并且其中所述方法还包括由模板rna分子或其衍生物产生条形码化互补脱氧核糖核酸(cdna)分子。在一些实施方案中,条形码化cdna分子在分配区中产生。在一些实施方案中,分配区包含第二多个核酸条形码分子,所述核酸条形码分子包含共同条形码序列和捕获序列。在一些实施方案中,捕获序列是聚-t序列。在一些实施方案中,捕获序列是模板转换寡核苷酸序列,并且其中条形码化cdna分子是使用模板转换反应产生。在一些实施方案中,多个核酸条形码分子附接于第一珠粒,第二多个核酸条形码分子附接于第二珠粒,并且其中分配区包括第一珠粒和第二珠粒。在一些实施方案中,第一珠粒或第二珠粒是磁珠。在一些实施方案中,第一珠粒是凝胶珠粒,并且第二珠粒是磁珠。在一些实施方案中,凝胶珠粒包括磁珠。在一些实施方案中,所述方法还包括降解凝胶珠粒。在一些实施方案中,第一珠粒是磁珠,并且第二珠粒是凝胶珠粒。在一些实施方案中,凝胶珠粒包括磁珠。在一些实施方案中,所述方法还包括降解凝胶珠粒。在一些实施方案中,多个核酸条形码分子和第二多个核酸条形码分子附接于珠粒,并且其中分配区还包括珠粒。在一些实施方案中,条形码化核酸片段和条形码化cdna分子从分配区释放。在一些实施方案中,所述方法还包括对条形码化核酸片段或其衍生物和条形码化cdna分子或其衍生物进行测序。在一些实施方案中,所述方法还包括使用(i)靶向一个或多个线粒体核酸片段的一个或多个导向核糖核酸分子(grna);和(ii)成簇规律间隔短回文序列(crispr)相关的(cas)核酸酶切割一个或多个线粒体核酸片段或其衍生物。在一些实施方案中,分配区还包括一个或多个grna和cas核酸酶。在一些实施方案中,cas核酸酶是cas9。在另一方面中,本公开提供了一种产生条形码化核酸片段的方法,包括:(a)提供:(i)多个生物颗粒,所述多个生物颗粒中的单个生物颗粒包含染色质,所述染色质包含模板核酸;(ii)包含转座子末端序列的多个转座子末端核酸分子;和(iii)多个转座酶分子;(b)借助于包含多个转座酶分子的转座酶分子和多个转座子末端核酸分子的转座子末端核酸分子的转座酶-核酸复合物在多个生物颗粒的生物颗粒中产生多个模板核酸片段;(c)产生包含生物颗粒的分配区,所述生物颗粒包含多个模板核酸片段和多个包含共同条形码序列的核酸条形码分子;以及(d)使用多个核酸条形码分子中的核酸条形码分子和多个模板核酸片段中的模板核酸片段产生条形码化核酸片段。在一些实施方案中,条形码化核酸片段通过将核酸条形码分子与模板核酸片段或其衍生物连接来产生。在一些实施方案中,条形码化核酸片段通过使用核酸条形码分子作为引物,核酸扩增模板核酸片段或其衍生物来产生。在一些实施方案中,多个核酸条形码分子附接于珠粒,并且其中分配区还包括珠粒。在一些实施方案中,核酸条形码分子可释放地附接于珠粒。在一些实施方案中,所述方法还包括从珠粒释放多个核酸条形码分子。在一些实施方案中,珠粒是凝胶珠粒。在一些实施方案中,凝胶珠粒是可降解的凝胶珠粒。在一些实施方案中,可降解的凝胶珠粒在施加刺激时可降解。在一些实施方案中,刺激是化学刺激。在一些实施方案中,刺激是还原剂。在一些实施方案中,分配区还包括含化学刺激。在一些实施方案中,在(c)之后,从生物颗粒释放模板核酸片段。在一些实施方案中,生物颗粒是细胞。在一些实施方案中,细胞是透化细胞。在一些实施方案中,生物颗粒是细胞核。在一些实施方案中,细胞核是透化细胞核。在一些实施方案中,分配区是乳液中的水性液滴。在一些实施方案中,分配区是孔。在一些实施方案中,所述方法还包括从分配区释放或去除条形码化核酸片段或其衍生物。在一些实施方案中,所述方法还包括对条形码化核酸片段或其衍生物进行测序。在一些实施方案中,多个转座子末端核酸分子包含多个第一核酸分子,所述第一核酸分子包含转座子末端序列和与多个核酸条形码分子的序列互补的序列。在一些实施方案中,多个转座子末端核酸分子还包含多个第二核酸分子,所述第二核酸分子包含转座子末端序列和引物序列。在一些实施方案中,多个核酸条形码分子是部分双链的并且包含:第一链,所述第一链包含共同条形码序列和与多个第一核酸分子的序列互补的序列;和第二链,所述第二链包含与共同条形码序列互补的序列。在一些实施方案中,多个核酸条形码分子是单链的并且包含共同条形码序列和与多个第一核酸分子的序列互补的序列。在一些实施方案中,生物颗粒还包含模板rna分子,并且其中所述方法还包括由模板rna分子或其衍生物产生条形码化cdna分子。在一些实施方案中,条形码化cdna分子在分配区中产生。在一些实施方案中,分配区包含第二多个核酸条形码分子,所述核酸条形码分子包含共同条形码序列和捕获序列。在一些实施方案中,捕获序列是聚-t序列。在一些实施方案中,捕获序列是模板转换寡核苷酸序列,并且其中条形码化cdna分子是使用模板转换反应产生。在一些实施方案中,多个核酸条形码分子附接于第一珠粒,第二多个核酸条形码分子附接于第二珠粒,并且其中分配区包括第一珠粒和第二珠粒。在一些实施方案中,第一珠粒或第二珠粒是磁珠。在一些实施方案中,第一珠粒是凝胶珠粒,并且第二珠粒是磁珠。在一些实施方案中,凝胶珠粒包括磁珠。在一些实施方案中,所述方法还包括降解凝胶珠粒。在一些实施方案中,第一珠粒是磁珠,并且第二珠粒是凝胶珠粒。在一些实施方案中,凝胶珠粒包括磁珠。在一些实施方案中,所述方法还包括降解凝胶珠粒。在一些实施方案中,多个核酸条形码分子和第二多个核酸条形码分子附接于珠粒,并且其中分配区还包括珠粒。在一些实施方案中,条形码化核酸片段和条形码化cdna分子从分配区释放。在一些实施方案中,所述方法还包括对条形码化核酸片段或其衍生物和条形码化cdna分子或其衍生物进行测序。在一些实施方案中,所述方法还包括(a)在细胞裂解剂和封闭剂存在下裂解多个细胞;以及(b)从多个裂解细胞中分离多个细胞核以产生多个生物颗粒,其中与不存在封闭剂时获得的测序读长相比,封闭剂减少对应于线粒体基因组的测序读长部分。在一些实施方案中,封闭剂是牛血清白蛋白(bsa)。在一些实施方案中,所述方法还包括使用(i)靶向一个或多个线粒体核酸片段的一个或多个导向核糖核酸分子(grna);和(ii)成簇规律间隔短回文序列(crispr)相关的(cas)核酸酶切割一个或多个线粒体核酸分子或其衍生物。在一些实施方案中,cas核酸酶是cas9。在一些实施方案中,线粒体核酸分子在(c)之前被切割。在一些实施方案中,线粒体核酸分子在分配区中被切割。在一些实施方案中,分配区包含cas核酸酶。在一些实施方案中,分配区还包含一个或多个grna。在一些实施方案中,线粒体核酸分子在(d)之后被切割。本公开的额外方面和优势从以下详细说明变得为本领域技术人员显而易知,其中仅示出并描述本公开的例示性实施方案。应当认识到的是,本公开能够具有其他以及不同的实施方案,并且其若干细节能够在各种不同方面做出修改,所有均不脱离公开内容。因此,附图和说明书应被视为在本质上是说明性的而不是限制性的。以引用的方式并入本说明书中提到的所有公布、专利和专利申请以引用的方式并入本文,引用程度如同已明确且个别地指示将各个别公布、专利和专利申请以引用的方式并入本文一般。如果通过引用并入的出版物和专利或专利申请与说明书中包含的公开内容相矛盾,则说明书旨在取代和/或优先于任何这样的矛盾材料。附图说明在所附权利要求中具体阐述本发明的新颖特征。通过参考阐述说明性实施方案的以下详细描述和附图(在本文中还有“图(figure和fig.)”)获得对本发明的特征和优点的更好理解,在所述说明性实施方案中利用本发明的原理,其中:图1显示了用于分配单个生物颗粒的微流体通道结构的实例。图2显示了用于将携带条形码的珠粒递送至液滴的微流体通道结构的实例。图3显示了用于共分配生物颗粒和试剂的微流体通道结构的实例。图4显示了用于将珠粒受控地分配到离散液滴中的微流体通道结构的实例。图5显示了用于增加液滴产生通量的微流体通道结构的实例。图6显示了用于增加液滴产生通量的微流体通道结构的另一实例。图7a显示了具有用于受控分配的几何特征的微流体通道结构的另一实例的横截面图。图7b显示了图7a的通道结构的透视图。图8说明了携带条形码的珠粒的实例。图9显示了已编程或以其他方式配置为实现本文提供的方法的计算机系统。图10说明了产生液滴的示例性方法,其中所形成的液滴中的至少一些将包含转座酶分子、单细胞和包含叉状衔接子的单个凝胶珠粒。图11a至图11b说明了产生叉状衔接子侧接的双链模板核酸片段的示例性方法。图11a说明用于将测序衔接子分配区内转座到天然染色质中的示例性方法,而图11b说明了用于由图11a中产生的片段批量生产下一代测序兼容文库的示例性方法。图12a至图12b说明了示例性叉状衔接子。图13说明产生液滴的示例性方法,其中所形成的液滴中的至少一些将包含转座酶-核酸复合物、单细胞和包含叉状衔接子的单个凝胶珠粒。图14a至图14b说明了产生叉状衔接子侧接的双链模板核酸片段的另一种示例性方法。图14a说明了用于将叉状衔接子分配区内连接到通过分配区内转座反应产生的天然染色质片段上的示例性方法。图14b说明了用于由图14a中产生的片段批量生产下一代测序兼容文库的示例性方法。图15a至图15b说明了另外的示例性叉状衔接子和含有寡核苷酸的转座子末端序列。图16说明了产生液滴的示例性方法,其中所形成的液滴中的至少一些将包含转座酶分子,单细胞和包含含有t7的衔接子的单个凝胶珠粒。图17说明了产生含有t7的衔接子侧接的双链模板核酸片段的示例性方法。图18说明了示例性的含有t7的条形码化衔接子。图19说明了产生液滴的示例性方法,其中所形成的液滴中的至少一些将包含转座酶分子,单细胞和包含条形码化衔接子的单个凝胶珠粒。图20说明了用于产生条形码化、衔接子侧接的核酸片段的示例性方案。图21说明了可释放地附接于凝胶珠粒的示例性部分双链条形码寡核苷酸。图22说明了随机引发延伸反应方案。图23说明了将条形码插入到模板核酸中的示例性方法。图24a至图24b说明了示例性转座酶-核酸复合物,其显示转座酶、可释放地附接于凝胶珠粒的第一部分双链寡核苷酸(第一部分双链寡核苷酸包含转座子末端序列、条形码序列和第一引物序列)以及包含转座子末端序列和第二引物序列的第二部分双链寡核苷酸。在图24b中,第一和第二引物序列是相同的。图25a至图25b说明了示例性条形码寡核苷酸。图25a说明了可释放地附接到凝胶珠粒的部分双链寡核苷酸,第一链包含转座子末端序列、条形码序列和第一引物序列,并且第二链包含与转座子末端序列互补的序列。图25b说明了可释放地附接到凝胶珠粒的部分双链寡核苷酸,第一链包含转座子末端序列和条形码序列,并且第二链包含与转座子末端序列互补的序列。图26说明了示例性转座酶-核酸复合物,所述转座酶-核酸复合物显示转座酶、第一双链寡核苷酸(所述第一双链寡核苷酸包含条形码序列和可释放地附接到第一凝胶珠粒的转座子末端序列)和第二双链寡核苷酸(所述第二双链寡核苷酸包含可释放地附接到第二凝胶珠粒的转座子末端序列)。图27说明了产生适合于下一代测序的条形码化核酸片段的示例性方法。图28a至图28b说明了示例性转座酶-核酸复合物和可释放地附接到凝胶珠粒的示例性条形码化衔接子。图28a说明了示例性转座酶-核酸复合物,所述转座酶-核酸复合物显示转座酶、包含转座子末端序列的第一双链寡核苷酸和包含转座子末端序列的第二双链寡核苷酸。图28b说明了示例性条形码化衔接子,所述条形码化衔接子包含转座子末端序列、条形码序列和可释放地附接到凝胶珠粒的引物序列。图29a至图29d说明了示例性转座酶-核酸复合物和示例性条形码化衔接子,所述示例性条形码化衔接子可以可释放地附接到凝胶珠粒。图29a说明了示例性转座酶-核酸复合物,所述转座酶-核酸复合物显示转座酶、包含转座子末端序列和第一引物序列的第一双链寡核苷酸以及包含转座子末端序列和第二引物序列的第二双链寡核苷酸。图28b说明了示例性条形码化衔接子,所述条形码化衔接子包含衔接子序列、条形码序列和与第一引物序列互补的序列。图28c-d说明了示例性条形码编码方案。图30a至图30b说明了示例性条形码寡核苷酸和组合本体/分配区内条形码编码方案。图31说明了示例性分配区内转座和条形码编码方案。图32a至图32c说明了示例性条形码编码方案。图32a说明了示例性条形码寡核苷酸;图32b说明了使用crispr/cas-9介导的切割的本体/分配区内条形码编码方案的示例性组合;图32c说明了使用crispr/cas-9介导的切割的示例性分配区内条形码编码方案。图33a至图33c说明了示例性条形码编码方案。图33a说明了示例性叉状条形码寡核苷酸;图33b说明了使用crispr/cas-9介导的切割的本体/分配区内条形码编码方案的示例性组合;图33c说明了使用crispr/cas-9介导的切割的示例性分配区内条形码编码方案。图34说明了条形码化磁性珠粒,其可以嵌入包含条形码化寡核苷酸的凝胶珠粒内。图35说明了用于单个细胞atac-seq(sc-atac-seq)加单个细胞rna-seq(scrna-seq)分析的示例性凝胶珠粒结构。bc=条形码。图36a至图36b说明了示例性scatac-seq方案。图36a提供了scatac-seq方案的细胞核制备的示意图。图36b说明了scatac-seq方案中的步骤所需的大致时间。图37说明了三种示例性部分双链条形码分子,其适用于如实施例9和18中所述的连接介导的atac-seq方案。为了评估三种条形码分子之间的条形码交换速率的差异,开发了两种修饰:较短的r1序列(中间),以及用尿嘧啶替换r1序列中的一个核酸(底部)。较短的r1(7b);u在r1中。图38a至图38c说明了混合的人和小鼠细胞核的示例性稗图(barnyardplot),其说明使用图37中的条形码分子从scatac-seq实验组装的测序读长。图38a说明了使用原始r1条形码分子(“对照”)的稗图。图38b说明了使用较短的r1条形码分子(“7b”)的稗图。图38c说明了使用含u的条形码分子(“u40”)的稗图。这些稗图表示小鼠(左上象限中的浅灰色点)和人核酸序列读长(右下象限中的中灰点)之间与噪声(左下象限中的黑点)和双峰(右上象限中的深灰点)的分离。图39说明了适用于如实施例11中所述的线性扩增介导的atac-seq方案的示例性单链条形码分子。在液滴中使用75nm、150nm或250nm浓度的引物。图40显示比较使用线性扩增或连接产生的不同重复样品文库(“a”和“b”)产生的测序度量的表。“a”重复表示在相同条件下,但使用不同的用户完成的反应,而“b”重复表示由相同用户在相同条件下完成的反应。图41a至图41b说明了检测的小鼠或人细胞的示例性量和从线性扩增atac-seq文库(使用75nm、150nm或250nm条形码引物)或基于连接的atac-seq文库(使用图37的条形码分子)的测序读长分析(图40)观察到的推断的双重速率。图41a说明了使用基于线性扩增或连接的atac-seq方法检测的小鼠或人细胞数量的差异。图41b说明了使用基于线性扩增或连接的atac-seq方法检测的推断的双重速率的差异。图42说明了通过每个细胞条形码的中值片段测量的从各种atac-seq文库获得的测序读长的灵敏度的比较。使用可编程微流体平台(fluidigm),与buenrostro等,nature,2015年7月23日;523(7561):486-90中描述的方法相比,文库制备的线性扩增和连接方法的灵敏度(36k读长/细胞)。图43说明了通过连接测序至增加的深度(30m读长和800m读长)制备的文库,而图40至图42说明灵敏度显著增加(通过每个细胞条形码的中值片段测量)和噪声降低(通过非重复的废弃读长的分数测量)。图44说明了使用基于线性扩增或连接的atac-seq方法制备的文库中的总噪声(非重复的废弃读长(“非重复读长”)和基于线粒体的读长(“mito”))的示例性比较。图45a至图45b提供了通过不同文库制备方法产生的分解测序读长的示例性说明。图45a显示了由线性扩增atac-seq文库产生的读长的分解图。图45b显示了由基于连接的atac-seq文库产生的读长的分解图。图46a至图46b说明了读长对的示例性比较,其显示了由使用基于线性扩增或连接的方案制备的atac-seq文库产生的核小体的周期性。通常在长度200bp以下观察到无核小体片段,指示核小体周期性为1的片段长度为约200bp,指示核小体周期性为2的片段长度为约400bp,指示核小体周期性为2的片段长度为约600bp等。图46a说明了来自通过线性扩增制备的文库的片段的插入物长度。图46b说明了来自通过连接制备的文库的片段的插入物长度。图47a至图47b说明了通过基于线性扩增或连接的方法制备的atac-seq文库中观察到的转录起始位点(tss)的示例性富集或ctcf(ccctc结合因子)位点的分析相对于与使用50,000个核的传统的整体atac-seq文库制备。图47a说明了tss数据的示例性富集。图47b说明了ctcf位点的富集。图48显示了比较从使用不同聚合酶制备的基于线性扩增的atac-seq文库以及通过连接制备的文库获得的示例性测序度量的表:dna聚合酶、kapahifidna聚合酶(与甜菜碱组合)、dna聚合酶。图49显示了提供约1,000pl液滴相对于较小的约400pl液滴的示例性参数的表。使用较小液滴尺寸的好处包括泊松推导的细胞双重速率降低约2倍,细胞通量增加约2倍。图50说明了如本文所述的atac-seq的方案,并与来自以下的数据比较(1)典型的高质量传统本体atac-seq方案;(2)cusanovich等,science,2015年5月22日;348(6237):910-14;(3)buenrostro等,nature,2015年7月23日;523(7561):486-90;(4)来自atac-seq实验的理想测序度量;(5)使用本文所述方法获得的数据(“10x”)。图51a至图51b显示外周血单核细胞(pbmc)样品中核酸的scrna-seq和scatac-seq分析的结果。图51a显示使用t分布随机近邻嵌入(t-distributedstochasticneighborembedding;tsne)产生的示例性散点图,允许可视化外周血单核细胞(pbmc)样品中不同亚群细胞类型的rna转录物。图51b显示使用t分布随机近邻嵌入(tsne)产生的示例性散点图,允许可视化外周血单核细胞(pbmc)样品中不同亚群细胞类型的atac-seq数据。具体实施方式虽然本文已经示出并描述本发明的各种实施方案,但是本领域技术人员显而易知这些实施方案仅作为举例来提供。许多改变、变化和取代可由本领域技术人员想到而不背离本发明。应理解,可使用本文所述的本发明的实施方案的各种替代方案。在将值描述为范围的情况下,应理解,此类公开内容包括公开在此范围内的所有可能的子范围,以及落入此范围内的特定数值,不管特定数值或特定子范围是否明确说明。如本文所用,术语“条形码”通常是指传达或能够传达关于分析物的信息的标记或标识符。条形码可以是分析物的一部分。条形码可以独立于分析物。除了分析物的内源特征(例如,分析物的大小或一个或多个末端序列)之外,条形码可以是附接于分析物(例如,核酸分子)的标签或标签的组合。条形码可以是独特的。条形码可以有多种不同的格式。例如,条形码可包括:多核苷酸条形码;随机核酸和/或氨基酸序列;和合成核酸和/或氨基酸序列。条形码可以以可逆或不可逆的方式附接于分析物。在样品测序之前、期间和/或之后,可以将条形码添加到例如脱氧核糖核酸(dna)或核糖核酸(rna)样品的片段中。条形码可以允许鉴定和/或定量各个测序读长。如本文所用,术语“实时”可以指小于约1秒、十分之一秒、百分之一秒、毫秒或更小的响应时间。响应时间可能大于1秒。在一些情况下,实时可以指同时或基本上同时的处理、检测或鉴定。如本文所用,术语“受试者”通常是指动物,例如哺乳动物(例如人)或禽类(例如鸟),或其他生物(例如植物)。例如,受试者可以是脊椎动物、哺乳动物、啮齿动物(例如小鼠)、灵长类动物、猿猴或人。动物可包括但不限于农场动物、运动型动物和宠物。受试者可以是健康的或无症状的个体、患有或疑似患有疾病(例如,癌症)或易患疾病的个体和/或需要治疗或疑似需要治疗的个体。受试者可以是患者。受试者可以是微生物(microorganism)或微生物(microbe)(例如,细菌、真菌、古细菌、病毒)。如本文所用,术语“基因组”通常是指来自受试者的基因组信息,其可以是例如受试者遗传信息的至少一部分或全部。基因组可以在dna或rna中编码。基因组可包含编码区(例如,蛋白质的编码区)以及非编码区。基因组可以包括生物体中所有染色体在一起的序列。例如,人类基因组普通具有共计46条染色体。所有这些染色体在一起的序列可构成人类基因组。术语“一个或多个衔接子”、“一个或多个接头”和“一个或多个标签”可以同义使用。接头或标签可以通过任何方法包括连接、杂交或其他方法与待“标记”的多核苷酸序列偶合。如本文所用,术语“测序”通常是指用于确定一种或多种多核苷酸中的核苷酸碱基的序列的方法和技术。多核苷酸可以是例如核酸分子例如脱氧核糖核酸(dna)或核糖核酸(rna),包括其变体或衍生物(例如,单链dna)。测序可以通过目前可用的各种系统执行,例如但不限于通过pacificbiosciencesoxford或lifetechnologies(ion)的测序系统。可替代地或另外地,可使用核酸扩增、聚合酶链式反应(pcr)(例如,数字pcr、定量pcr或实时pcr)或等温扩增来执行测序。这样的系统可以提供对应于受试者(例如人)的遗传信息的多个原始遗传数据,如从受试者提供的样品由系统所产生。在一些实例中,此类系统提供测序读长(本文中也称为“读长”)。读长可以包括一串核酸碱基,其对应于已经测序的核酸分子的序列。在一些情况下,本文提供的系统和方法可与蛋白质组信息一起使用。如本文所用,术语“珠粒”通常是指颗粒。珠粒可以是固体或半固体颗粒。珠粒可以是凝胶珠粒。凝胶珠粒可包括聚合物基体(例如,通过聚合或交联形成的基体)。聚合物基体可包括一种或多种聚合物(例如,具有不同官能团或重复单元的聚合物)。聚合物基体中的聚合物可以随机排列,例如在无规共聚物中,和/或具有有序结构,例如在嵌段共聚物中。交联可以通过共价、离子或诱导、相互作用或物理缠结。珠粒可以是大分子。珠粒可以由结合在一起的核酸分子形成。珠粒可以通过分子(例如大分子)的共价或非共价组装形成,例如单体或聚合物。这些聚合物或单体可以是天然的或合成的。此类聚合物或单体可以是或包括例如核酸分子(例如dna或rna)。珠粒可以由聚合物材料形成。珠粒可以是磁性的或非磁性的。珠粒可以是刚性的。珠粒可以是柔性的和/或可压缩的。珠粒可以是可破坏的或可溶解的。珠粒可以是用包含一种或多种聚合物的涂层覆盖的固体颗粒(例如,包括但不限于氧化铁、金或银的金属基颗粒)。这种涂层可以是可破坏的或可溶解的。如本文所用,术语“样品”通常是指受试者的生物样品。生物样品可包含任何数量的大分子,例如细胞大分子。样品可以是细胞样品。样品可以是细胞系或细胞培养物样品。样品可包括一个或多个细胞。样品可包括一种或多种微生物。生物样品可以是核酸样品或蛋白质样品。生物样品也可以是碳水化合物样品或脂质样品。生物样品可以来源于另一样品。样品可以是组织样品,例如活组织检查、核心活组织检查(corebiopsy)、针吸出物或细针吸出物。样品可以是流体样品,例如血液样品、尿样品或唾液样品。样品可以是皮肤样品。样品可以是面颊拭子(cheekswab)。样品可以是血浆或血清样品。样品可以是无细胞或不含细胞样品。无细胞样品可包括细胞外多核苷酸。细胞外多核苷酸可以从身体样品中分离,所述身体样品可以选自由血液、血浆、血清、尿液、唾液、粘膜分泌物、痰液、粪便和泪液组成的群组。如本文所用,术语“生物颗粒”通常是指来源于生物样品的离散生物系统。生物颗粒可以是大分子。生物颗粒可以是小分子。生物颗粒可以是病毒。生物颗粒可以是细胞或细胞衍生物。生物颗粒可以是细胞器。生物颗粒可以是来自细胞群的稀有细胞。生物颗粒可以是任何类型的细胞,包括但不限于原核细胞、真核细胞、细菌、真菌、植物、哺乳动物或其他动物细胞型、支原体、正常组织细胞、肿瘤细胞或任何其他细胞型,无论是来源于单细胞还是多细胞生物。生物颗粒可以是细胞的组分。生物颗粒可以是或可包括dna、rna、细胞器、蛋白质或其任何组合。生物颗粒可以是或包括染色体或基因组的其他部分。生物颗粒可以是或可以包括基体(例如,凝胶或聚合物基体),其包含细胞或来自细胞的一种或多种组分(例如,细胞珠),例如来自细胞的dna、rna、细胞器、蛋白质或其任何组合。生物颗粒可以从受试者的组织获得。生物颗粒可以是硬化细胞。这种硬化细胞可以包括或不包括细胞壁或细胞膜。生物颗粒可包括细胞的一种或多种组分,但可不包括细胞的其他组分。这些组分的一个实例是细胞核或细胞器。细胞可以是活细胞。活细胞可以能够被培养,例如,当被包封在凝胶或聚合物基体中时被培养,或者当包含凝胶或聚合物基体时被培养。如本文所用,术语“大分子组分”通常是指包含在生物颗粒内或来自生物颗粒的大分子。大分子组分可包含核酸。在一些情况下,生物颗粒可以是大分子。大分子组分可包含dna。大分子组分可包含rna。rna可以是编码的或非编码的。例如,rna可以例如是信使rna(mrna)、核糖体rna(rrna)或转移rna(trna)。rna可以是转录物。rna可以是长度小于200个核酸碱基的小rna,或长度大于200个核酸碱基的大rna。小rna可包括5.8s核糖体rna(rrna)、5srrna、转移rna(trna)、微rna(mirna)、小干扰rna(sirna)、核仁小rna(snorna)、piwi相互作用rna(pirna)、trna衍生的小rna(tsrna)和小rdna衍生的rna(srrna)。rna可以是双链rna或单链rna。rna可以是环状rna。大分子组分可包含蛋白质。大分子组分可包含肽。大分子组分可包含多肽。如本文所用,术语“分子标签”通常是指能够结合大分子组分的分子。分子标签可以以高亲和力结合大分子组分。分子标签可以以高特异性结合大分子组分。分子标签可包含核苷酸序列。分子标签可包含核酸序列。核酸序列可以是分子标签的至少一部分或全部。分子标签可以是核酸分子或可以是核酸分子的一部分。分子标签可以是寡核苷酸或多肽。分子标签可包含dna适体。分子标签可以是或包含引物。分子标签可以是或包含蛋白质。分子标签可包含多肽。分子标签可以是条形码。如本文所用,术语“分配区”通常是指可适合于包含一种或多种物质或进行一个或多个反应的空间或体积。分配区可以是物理隔室,例如液滴或孔。分配区可以将空间或体积与另一个空间或体积隔离。液滴可以是与第一相不混溶的第二相(例如油)中的第一相(例如水相)。液滴可以是不与第一相相分离的第二相中的第一相,例如像水相中的胶囊或脂质体。分配区可以包括一个或多个其他(内部)分配区。在一些情况下,分配区可以是虚拟隔室,其可以由在多个和/或远程物理隔室上的索引(例如,索引库)来定义和鉴定。例如,物理隔室可包括多个虚拟隔室。使用测序(atac-seq)针对转座酶可接近性染色质的单细胞测定在一些实施方案中,本文公开了用于核酸处理的方法。用于核酸处理的方法可包括产生分配区(例如,液滴或孔),其包含:(i)包含染色质的生物颗粒(例如,细胞或细胞核),所述染色质包含模板核酸分子;(ii)包含共同条形码序列的多个核酸条形码分子;(iii)包含转座子末端序列的多个转座子末端核酸分子;和(iv)多个转座酶分子。然后可以借助于转座酶-核酸复合物产生多个模板核酸片段,所述转座酶-核酸复合物包含多个转座酶分子中的转座酶分子和多个转座子末端寡核苷酸分子中的转座子末端寡核苷酸分子。然后可以使用多个核酸条形码分子中的核酸条形码分子和多个模板核酸片段中的模板核酸片段产生条形码化核酸片段。本公开还公开了一种产生条形码化核酸片段的方法,其包括提供:(i)多个生物颗粒(例如,细胞或细胞核),所述多个生物颗粒中的单独的生物颗粒包含染色质,所述染色质包含模板核酸;(ii)包含转座子末端序列的多个转座子末端核酸分子;和(iii)多个转座酶分子。然后可以借助于包含多个转座酶分子中的转座酶分子和多个转座子末端核酸分子中的转座子末端核酸分子的转座酶-核酸复合物在多个生物颗粒中的生物颗粒中产生多个模板核酸片段。然后可以产生分配区,其中分配区包含有包含多个模板核酸片段的生物颗粒和包含共同条形码序列的多个核酸条形码分子。然后可以使用多个核酸条形码分子中的核酸条形码分子和多个模板核酸片段中的模板核酸片段产生条形码化核酸片段。在一些实施方案中,转座酶是tn5转座酶。在一些实施方案中,转座酶是突变的、过度活跃的tn5转座酶。在一些实施方案中,转座酶是mu转座酶。在一些实施方案中,(a)中公开的分配区还包含细胞裂解试剂;和/或(b)进行一个或多个反应所必需的试剂和缓冲剂。在一些实施方案中,分配区(例如,液滴或孔)包含单细胞并根据本文所述的方法进行处理。在一些实施方案中,分配区包含单细胞和/或单细胞核。可以根据本文所述的方法分配和处理单细胞和/或单细胞核。在一些情况下,单细胞核可以是细胞的组成部分。在一些实施方案中,分配区包含来自单细胞或单细胞核的染色质(例如,单染色体或基因组的其他部分),并且根据本文所述的方法进行分配和处理。在一些实施方案中,本文所述的转座反应和方法是批量执行的,然后将生物颗粒(例如,来自单细胞的细胞核/细胞/染色质)分配,使得多个分配区被生物颗粒(例如,细胞、细胞核、染色质或细胞珠)单独占据。例如,可以将多个生物颗粒分配到多个分配区中,使得多个分配区中的分配区包括单个生物颗粒。在一些实施方案中,本文所述的寡核苷酸包含转座子末端序列。在一些实施方案中,转座子末端序列是tn5或修饰的tn5转座子末端序列。在一些实施方案中,转座子末端序列是mu转座子末端序列。在一些实施方案中,转座子末端序列具有以下序列:agatgtgtataagagaca(seqidno:1)。在一些实施方案中,本文所述的寡核苷酸包含r1测序引发区。在一些实施方案中,r1测序引物区具有以下序列:tctacactctttccctacacgacgctcttccgatct(seqidno:2),或其某一部分。在一些实施方案中,r1测序引物区具有以下序列:tcgtcggcagcgtcagatgtgtataagagacag(seqidno:3),或其某一部分。在一些实施方案中,本文所述的寡核苷酸包含部分r1序列。在一些实施方案中,部分r1序列是actacacgacgctcttccgatct(seqidno:4)。在一些实施方案中,本文所述的寡核苷酸包含r2测序引发区。在一些实施方案中,r2测序引物区具有以下序列:gtgactggagttcagacgtgtgctcttccgatct(seqidno:5),或其某一部分。在一些实施方案中,r2测序引物区具有以下序列:gtctcgtgggctcggagatgtgtataagagacag(seqidno:6),或其某一部分。在一些实施方案中,本文所述的寡核苷酸包含t7启动子序列。在一些实施方案中,t7启动子序列是taatacgactcactatag(seqidno:7)。在一些实施方案中,本文所述的寡核苷酸包含与seqidno:1-7中的任一个具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的区域。在一些实施方案中,本文所述的寡核苷酸包含p5序列。在一些实施方案中,本文所述的寡核苷酸包含p7序列。在一些实施方案中,本文所述的寡核苷酸包含样品索引序列。在一些实施方案中,本文所述的寡核苷酸附接于固体支持物(例如,固体或半固体颗粒,例如珠粒)。在一些实施方案中,本文所述的寡核苷酸附接于珠粒。在一些实施方案中,珠粒是凝胶珠粒。在一些实施方案中,本文所述的寡核苷酸可释放地附接于珠粒(例如凝胶珠粒)。在一些实施方案中,本文所述的寡核苷酸是单链的并且第一链附接于珠粒。在一些实施方案中,本文所述的寡核苷酸是双链或部分双链分子,并且第一链可释放地附接于珠粒。在一些实施方案中,本文所述的寡核苷酸是双链或部分双链分子,并且第二链可释放地附接于珠粒。在一些实施方案中,本文所述的寡核苷酸是双链或部分双链分子,并且第一和第二链均可释放地附接于珠粒或珠粒集合。在一些实施方案中,固体支持物(例如珠粒,例如凝胶珠粒)包含多个第一寡核苷酸和多个第二寡核苷酸。在一些实施方案中,第一寡核苷酸、第二寡核苷酸或其组合可释放地附接于珠粒。在一些实施方案中,第一寡核苷酸、第二寡核苷酸或其组合是双链或部分双链分子,并且第一链可释放地附接于珠粒。在一些实施方案中,第一寡核苷酸、第二寡核苷酸或其组合是双链或部分双链分子,并且第二链可释放地附接于珠粒。在一些实施方案中,第一寡核苷酸、第二寡核苷酸或其组合是双链或部分双链分子,并且第一链和第二链可释放地附接于珠粒。在一些实施方案中,寡核苷酸、第一寡核苷酸、第二寡核苷酸或其组合与磁性颗粒结合。在一些实施方案中,将磁性颗粒包埋在固体支持物(例如珠粒,例如凝胶珠粒)中。在一些实施方案中,第一寡核苷酸能够与dna分子偶合(例如,通过核酸杂交),并且第二寡核苷酸能够与rna分子(例如,mrna分子)偶合(例如,通过核酸杂交)。寡核苷酸架构的实例在图35中提供。在一些实施方案中,第一寡核苷酸包含p5衔接子序列、条形码序列和r1序列或部分r1引物序列。在一些实施方案中,第二寡核苷酸包含r1序列或部分r1引物序列、条形码序列、独特分子标识符(umi)序列和聚(dt)序列。在一些实施方案中,第二寡核苷酸包含r1序列或部分r1引物序列、条形码序列、独特分子标识符(umi)序列和转换寡核苷酸。在一些实施方案中,第一寡核苷酸包含p5衔接子序列、条形码序列和r1序列或部分r1引物序列并且是部分双链的,并且第二寡核苷酸包含r1或部分r1引物序列、条形码序列、独特分子标识符(umi)序列和聚(dt)序列。在一些实施方案中,第一寡核苷酸包含p5衔接子序列、条形码序列和r1或部分r1引物序列并且是单链的,并且第二寡核苷酸包含r1或部分r1序列、条形码序列、独特分子标识符(umi)序列和模板转换寡核苷酸序列。用于样品区室化的系统和方法在一个方面中,本文所述的系统和方法提供将一个或多个颗粒(例如,生物颗粒、生物颗粒的大分子组分、珠粒、试剂等)区室化、沉积和/或分配到离散隔室或分配区(在本文中可互换地称为分配区)中,其中每个分配区保持其自己的内容物与其他分配区的内容物的分离。分配区可以是例如孔或乳液中的液滴。分配区可以包括一个或多个其他分配区。分配区可包括一个或多个颗粒。分配区可包括一种或多种类型的颗粒。例如,本公开的分配区可包含一个或多个生物颗粒和/或其大分子组分。例如,分配区可包含一个或多个细胞、细胞核、染色质和/或细胞珠。例如,分配区可包含一个或多个细胞珠。细胞珠可以是例如通过含有生物颗粒的液滴和能够被聚合或胶凝的前体的聚合而包裹在凝胶或聚合物基体内的生物颗粒和/或其大分子组分中的一种或多种。分配区可包括一个或多个固体或半固体颗粒。例如,分配区可包括一个或多个珠粒,例如一个或多个凝胶珠粒。在一些情况下,分配区可包括单个凝胶珠粒、单个细胞珠或单个细胞珠和单个凝胶珠粒两者。分配区可包括一种或多种试剂(例如,如本文所述)。可以在液滴产生之前、之后或同时例如通过微胶囊(例如珠粒)将独特标识符(例如条形码)注射到液滴中,如本文其他地方所述。条形码可包含核酸序列。此类核酸条形码序列可以是核酸条形码分子的组成部分,其可以被偶合(例如,可释放地偶合)至固体或半固体颗粒,例如珠粒。在一些情况下,分配区可能未被占据。例如,分配区可以不包含珠粒或生物颗粒。包含一个或多个通道(例如,芯片的微流体通道网络)的微流体装置可用于产生如本文所述的分配区。例如,第一流体和与第一流体不混溶的第二流体可以流到液滴生成汇合点处,并且第一流体的液滴可以在第二流体内产生。在单个生物颗粒的分配中也可以采用替代机制,包括多孔膜,通过多孔膜将细胞的含水混合物挤出到非含水流体中。分配区可在流体流内流动。分配区可包括例如微囊泡,其具有围绕内部流体中心或核心的外部屏障。在一些情况下,分配区可包括多孔基体,其能够在其基体内夹带和/或保留材料。分配区可以是第二相内的第一相的液滴,其中第一相和第二相是不混溶的。例如,分配区可以是非含水连续相(例如油相)内的含水流体的液滴。在另一个实例中,分配区可以是水相内的非含水流体的液滴。在一些实施例中,分配区可以以油包水乳液或水包油乳液形式提供。在例如美国专利申请公开第2014/0155295号中描述了多种不同的容器,所述申请出于所有目的以全文引用方式并入本文。用于在非含水或油状连续相中产生稳定液滴的乳液体系描述于例如美国专利申请公开第2010/0105112号中,所述申请出于所有目的以全文引用方式并入本文。就乳液中的液滴而言,在一个非限制性实例中,将单个颗粒分配到离散分配区中可以通过将含水流体中的颗粒的流动流引入非含水流体的流动流中,使得在两股流的汇合点处产生液滴来实现。流体性质(例如,流体流速、流体粘度等)、颗粒性质(例如,体积分数、颗粒尺寸、颗粒浓度等)、微流体架构(例如,通道几何形状等)和其他参数可以被调节成控制所得分配区的占据率(例如,每个分配区的生物颗粒数、每个分配区的珠粒数等)。例如,可以通过以一定颗粒浓度和/或流速提供含水流来控制分配区占据率。为了产生单个生物颗粒分配区,可以选择不混溶流体的相对流速,使得平均而言,分配区可以每个分配区包含少于一个生物颗粒,以确保被占据的那些分配区主要被单独占据。在一些情况下,多个分配区中的分配区可以包含至多一个生物颗粒(例如,细胞珠、染色质、dna、细胞、细胞核或其他细胞材料)。在一些实施方案中,可以选择或调整各种参数(例如,流体性质、颗粒性质、微流体架构等),使得大多数分配区被占据,例如,仅允许一小部分未占据的分配区。可以控制流和通道架构以确保给定数量的单独占据分配区、小于一定水平的未占据分配区和/或小于一定水平的多占据分配区。图1显示了用于分配单个生物颗粒(例如,如本文所述)的微流体通道结构100的实例。通道结构100可包括在通道汇合点110处连通的通道区段102、104、106和108。在操作中,包括悬浮生物颗粒(或细胞)114的第一含水流体112可沿通道区段102输送到汇合点110中,同时与含水流体112不混溶的第二流体116从通道区段104和106中的每一个输送到汇合点110,以产生第一含水流体112的离散液滴118、120,离散液滴118、120流入通道区段108并从汇合点110流走。通道区段108可以流体联接到可以储存和/或收集离散液滴的出口贮存器。产生的离散液滴可包括单独的生物颗粒114(例如液滴118)。产生的离散液滴可包括多于一个单独生物颗粒114(图1中未示出)。离散液滴可以不包含生物颗粒114(例如液滴120)。每个离散分配区可以保持其自身内容物(例如,单独的生物颗粒114)与其他分配区的内容物的分离。第二流体116可包含油,例如氟化油,其包括用于稳定所得液滴(例如,抑制所得液滴118、120的后续聚结)的含氟表面活性剂。特别有用的分配流体和含氟表面活性剂的实例描述于例如美国专利申请公开第2010/0105112号中,所述申请出于所有目的以全文引用方式并入本文。如将理解的,本文描述的通道区段可以联接到多种不同流体源或接收部件中的任一个,包括其他系统的贮存器、管道、歧管或流体部件。如将理解的,微流体通道结构100可具有其他几何形状。例如,微流体通道结构可具有多于一个通道汇合点。例如,微流体通道结构可具有2、3、4或5个通道区段,所述通道区段各自承载在通道汇合点处相遇的颗粒(例如,生物颗粒、细胞珠和/或固体或半固体颗粒,例如凝胶珠粒)。可以通过一个或多个流体流动单元引导流体沿着一个或多个通道或贮存器流动。流体流动单元可包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。还可以或以其他方式通过施加的压力差、离心力、电动泵送、真空、毛细管或重力流等来控制流体。产生的液滴可以包括两个液滴子组:(1)占据的液滴118,其包含一个或多个生物颗粒114,和(2)未占据的液滴120,其不包含任何生物颗粒114。占据的液滴118可以包括单占液滴(具有一个生物颗粒)和多占液滴(具有多于一个生物颗粒)。如本文其他地方所述,在一些情况下,大多数占据的分配区可以每个占据的分配区包括不多于一个生物颗粒,并且一些产生的分配区可以未被(任何生物颗粒)占据。但是,在一些情况下,一些占据的分配区可能包括多于一个生物颗粒。在一些情况下,可以控制分配过程,使得少于约25%的占据分配区包含多于一个生物颗粒,并且在许多情况下,少于约20%的占据分配区具有多于一个生物颗粒,而在一些情况下,少于约10%或甚至少于约5%的占据分配区包括每个分配区多于一个生物颗粒。在一些情况下,可能希望最小化过度数量空分配区的产生,例如以降低成本和/或提高效率。尽管这种最小化可以通过在分配汇合点110处提供足够数量的生物颗粒(例如,生物颗粒114)例如以确保至少一个生物颗粒被包封在分配区中来实现,但是泊松分布可以预期地增加包含多个生物颗粒的分配区的数量。因此,在要获得单占分配区的情况下,至多约95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%、5%或更少产生的分配区可以是未被占据的。在一些情况下,可以控制一个或多个生物颗粒(例如,在通道区段102中)的流动,或者引导到分配汇合点中的其他流体(例如,在通道区段104、106中)的流动,使得在许多情况下,不多于约50%产生的分配区、不多于约25%产生的分配区或不多于约10%产生的分配区未被占据。可以控制这些流以便呈现单占分配区的非泊松分布,同时提供较低水平的未占据分配区。可以实现上述范围的未占据分配区,同时仍然提供上述任何单占率。例如,在许多情况下,使用本文所述的系统和方法可以导致具有小于约25%、小于约20%、小于约15%、小于约10%,并且在许多情况下,小于约5%的多占率的分配区,同时具有小于约50%、小于约40%、小于约30%、小于约20%、小于约10%、小于约5%或更少的未占据分配区。如应理解,上述占据率也适用于包括生物颗粒和额外试剂的分配区,包括但不限于携带条形码化核酸分子(例如,寡核苷酸)的微胶囊或珠粒(例如凝胶珠粒)(参照图2描述)。占据分配区(例如,至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或99%的占据分配区)可包括包含条形码化核酸分子的微胶囊(例如珠粒)和生物颗粒。在另一方面中,除了基于液滴的分配之外或作为基于液滴的分配的替代,生物颗粒(例如,如本文所述)可以包封在微胶囊内,所述微胶囊包括其中夹带有一个或多个单独生物颗粒或少量生物颗粒的外壳、层或多孔基体。微胶囊可包括其他试剂。可以通过多种方法执行生物颗粒的包封。这些方法可以将含有生物颗粒的含水流体与聚合物前体材料组合,所述聚合物前体材料在将特定刺激施加到聚合物前体时能够形成凝胶或其他固体或半固体基体。这样的刺激可以包括,例如,热刺激(例如,加热或冷却)、光刺激(例如,通过光固化)、化学刺激(例如,通过交联、前体的聚合引发(例如,通过添加的引发剂))、机械刺激或其组合。包含生物颗粒的微胶囊的制备可以通过多种方法执行。例如,气刀液滴或气溶胶发生器可用于将前体流体液滴分配到胶凝溶液中,以形成包含单独生物颗粒或少量生物颗粒的微胶囊。同样地,基于膜的包封系统可用于产生包含如本文所述的包封生物颗粒的微胶囊。本公开的微流体系统,例如图1中所示的微流体系统,可以如本文所述易于用于包封细胞。特别地,并且参考图1,包含(i)生物颗粒114和(ii)聚合物前体材料(未示出)的含水流体112流入通道汇合点110,在通道汇合点110中含水流体112通过非含水流体116的流动被分配成液滴118、120。就包封方法而言,非含水流体116还可包括引发剂(未示出),以引起聚合物前体的聚合和/或交联,从而形成包含夹带的生物颗粒的微胶囊。聚合物前体/引发剂对的实例包括美国专利申请公开第2014/0378345号中描述的那些,所述申请出于所有目的以全文引用方式并入本文。例如,在聚合物前体材料包含线性聚合物材料(例如线性聚丙烯酰胺、peg或其他线性聚合物材料)的情况下,活化剂可包含交联剂或活化在所形成的液滴中的交联剂的化学品。同样,对于包含可聚合单体的聚合物前体,活化剂可包含聚合引发剂。例如,在某些情况下,当聚合物前体包含丙烯酰胺单体与n,n'-双-(丙烯酰基)胱胺(bac)共聚单体的混合物时,可在通道区段104和106中的第二流体流116内提供诸如四乙基甲二胺(temed)的试剂,其可以引发丙烯酰胺和bac共聚成交联聚合物网络或水凝胶。在汇合点110处第二流体流116与第一流体流112接触时,在液滴形成期间,temed可以从第二流体116扩散到包含线性聚丙烯酰胺的含水流体112中,这将活化液滴118、120内的聚丙烯酰胺的交联,导致以夹带生物颗粒(例如,细胞)114的固体或半固体珠粒或颗粒的形式的凝胶(例如,水凝胶)微胶囊的形成。尽管描述了聚丙烯酰胺包封,但其他“可活化的”包封组合物也可用于本文所述的方法和组合物的上下文中。例如,形成藻酸盐液滴,然后暴露于二价金属离子(例如,ca2+离子),可以用作使用所述方法的包封方法。同样地,琼脂糖液滴也可以通过基于温度的胶凝(例如,在冷却时等)转化成胶囊。在一些情况下,包封的生物颗粒可以选择性地从微胶囊中释放,例如通过时间的推移或在施加特定刺激时,所述刺激使微胶囊充分降解以允许生物颗粒(例如,细胞)或其其他内容物从微胶囊中释放,例如进入分配区(例如,液滴)。例如,就上述聚丙烯酰胺聚合物而言,微胶囊的降解可以通过引入适当的还原剂如二硫苏糖醇(dtt)等以裂解交联聚合物基体的二硫键来完成。参见,例如,美国专利申请公开第2014/0378345号,述申请出于所有目的以全文引用方式并入本文。可以使生物颗粒经受足以聚合或胶凝前体的其他条件。足以聚合或胶凝前体的条件可包括暴露于加热、冷却、电磁辐射和/或光。足以聚合或胶凝前体的条件可包括足以聚合或胶凝前体的任何条件。在聚合或胶凝之后,可以在生物颗粒周围和/或内部形成聚合物或凝胶。聚合物或凝胶可扩散地渗透到化学或生物化学试剂中。聚合物或凝胶不可扩散地渗透到生物颗粒的大分子组分中。以这种方式,聚合物或凝胶可以起允许生物颗粒经受化学或生物化学操作,同时在空间上将大分子组分限制在由聚合物或凝胶限定的液滴区域的作用。聚合物或凝胶可包括二硫键交联的聚丙烯酰胺、琼脂糖、藻酸盐、聚乙烯醇、聚乙二醇(peg)-二丙烯酸酯、peg-丙烯酸酯、peg-硫醇、peg-叠氮化物、peg-炔烃、其他丙烯酸酯、壳聚糖、透明质酸、胶原蛋白、纤维蛋白、明胶或弹性蛋白中的一种或多种。聚合物或凝胶可包含任何其他聚合物或凝胶。包含聚合物或凝胶基体的细胞可被称为“细胞珠”。可以将聚合物或凝胶官能化以结合目标分析物,例如核酸、蛋白质、碳水化合物、脂质或其他分析物。聚合物或凝胶可以通过被动机制聚合或胶凝。例如,聚合或胶凝可以通过盐度、ph、温度或压力的变化来发生。聚合物或凝胶可以在碱性条件下或在升高的温度下是稳定的。聚合物或凝胶可具有与珠粒的机械性质类似的机械性质。例如,聚合物或凝胶基体可具有与珠粒类似的尺寸。聚合物或凝胶可具有与珠粒类似的机械强度(例如拉伸强度)。聚合物或凝胶的密度可以低于油。聚合物或凝胶的密度可以与缓冲液的密度大致类似。聚合物或凝胶可具有可调的孔径。可以选择孔径以例如保留变性的核酸。可以选择孔径以保持对外源性化学物质如氢氧化钠(naoh)和/或内源性化学物质如抑制剂的扩散渗透性。聚合物或凝胶可以是生物相容的。聚合物或凝胶可以保持或增强细胞活力。聚合物或凝胶可以是生物化学相容的。聚合物或凝胶可以以热、化学、酶促和/或光的方式聚合和/或解聚。聚合物或凝胶可包含与二硫键交联的聚(丙烯酰胺-共-丙烯酸)。聚合物或凝胶的制备可包括两步反应。在第一活化步骤中,可以将聚(丙烯酰胺-共-丙烯酸)暴露于酰化剂以将羧酸转化为酯。例如,可以将聚(丙烯酰胺-共-丙烯酸)暴露于4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉氯化物(dmtmm)。可以将聚丙烯酰胺-共-丙烯酸暴露于4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉的其他盐。在第二交联步骤中,可以将在第一步中形成的酯暴露于二硫化物交联剂。例如,可以将酯暴露于胱胺(2,2'-二硫代双(乙胺))。在这两个步骤之后,生物颗粒可以被通过二硫桥连接在一起的聚丙烯酰胺链包围。以这种方式,生物颗粒可以被包裹在凝胶或基体(例如,聚合物基体)内部或包含凝胶或基体以形成“细胞珠”。细胞珠可以包含生物颗粒(例如,细胞)或生物颗粒的大分子组分(例如,rna、dna、蛋白质等)。细胞珠可包括单个细胞或多个细胞,或单个细胞或多个细胞的衍生物。例如,在裂解和洗涤细胞后,可以从细胞裂解物中洗去抑制成分,并且可以将大分子组分结合为细胞珠。本文公开的系统和方法可适用于含有生物颗粒的细胞珠(和/或液滴或其他分配区)和含有生物颗粒的大分子组分的细胞珠(和/或液滴或其他分配区)。与基于液滴分配的生物颗粒相比,包封的生物颗粒可以提供更易储存和更便携的某些潜在优点。此外,在一些情况下,希望允许生物颗粒在分析之前温育一段选定时间,例如以便表征在存在或不存在不同刺激的情况下此类生物颗粒随时间的变化。在这种情况下,与在乳液液滴中分配相比,包封可以允许更长时间的温育,但是在一些情况下,液滴分配的生物颗粒也可以温育不同的时间段,例如,至少10秒、至少30秒、至少1分钟、至少5分钟、至少10分钟、至少30分钟、至少1小时、至少2小时、至少5小时、或至少10小时或更长时间。生物颗粒的包封可以构成生物颗粒的分配,其他试剂在其中共分配。可替代地或另外地,包封的生物颗粒可以轻易地沉积到如上所述的其他分配区(例如,液滴)中。珠粒分配区可以包括一个或多个独特标识符,例如一个或多个条形码。条形码可以预先、随后或同时递送到保持分室化或分配生物颗粒的分配区。例如,可以在液滴产生之前、之后或同时将条形码注射到液滴中。将条形码递送到特定分配区允许稍后将单独生物颗粒的特征归属于特定分配区。条形码可以例如作为核酸分子的组成部分(例如,寡核苷酸)递送。条形码可以通过任何合适的机制递送到分配区。例如,条形码化核酸分子可以通过微胶囊或珠粒递送到例如液滴或孔的分配区中。在一些情况下,微胶囊可包含珠粒。珠粒在下面进一步详细描述。在一些情况下,条形码化核酸分子可以最初与微胶囊或珠粒缔合,然后从微胶囊或珠粒释放。例如,珠粒可包含可释放地与其偶合的多个核酸条形码分子。条形码化核酸分子的释放可以是被动的(例如,通过从微胶囊或珠粒中扩散出来)。额外地或替代地,从微胶囊或珠粒中释放可以在施加允许条形码化核酸分子从微胶囊或珠粒中解离或释放的刺激时。这种刺激可以破坏微胶囊或珠粒,是将条形码化核酸分子与微胶囊或珠粒或两者偶合或在微胶囊或珠粒或两者内偶合的相互作用。这种刺激可以包括,例如,热刺激、光刺激、化学刺激(例如,ph的变化或使用一种或多种还原剂)、机械刺激、辐射刺激;生物刺激(例如酶)或其任何组合。图2显示了用于将携带条形码的珠粒递送到液滴的微流体通道结构200的实例。通道结构200可包括在通道汇合点210处连通的通道区段201、202、204、206和208。在操作中,通道区段201可将包含多个珠粒214(例如,包含核酸条形码分子、寡核苷酸或分子标签的珠粒)的含水流体212沿着通道区段201输送到汇合点210处。多个珠粒214可以源自珠粒的悬浮液。例如,通道区段201可以连接到包含珠粒214的含水悬浮液的贮存器。通道区段202可以将包括多个生物颗粒216的含水流体212沿着通道区段202输送到汇合点210。多个生物颗粒216可以源自生物颗粒的悬浮液。例如,通道区段202可以连接到包含生物颗粒216的含水悬浮液的贮存器。在一些情况下,第一通道区段201或第二通道区段202中或两个区段中的含水流体212可以包括一种或多种试剂,如下面进一步描述的。与含水流体212不混溶的第二流体218(例如,油)可以从通道区段204和206中的每一个被递送到汇合点210。在来自通道区段201和202中的每一个的含水流体212与来自通道区段204和206中的每一个的第二流体218在通道汇合点210处相遇时,含水流体212可以在第二流体218中以离散液滴220的形式被分配并且沿着通道区段208从汇合点210流出。通道区段208可以将离散液滴递送到流体联接到通道区段208的出口贮存器,在所述贮存器中将它们加以收集。作为替代方案,通道区段201和202可以在汇合点210的上游的另一个汇合点处相遇。在这样的汇合点处,珠粒和生物颗粒可以形成混合物,所述混合物沿着另一个通道被引导到汇合点210以产生液滴220。所述混合物可以以交替的方式提供珠粒和生物颗粒,使得例如液滴包含单个珠粒和单个生物颗粒。珠粒、生物颗粒和液滴(例如,包含珠粒和/或生物颗粒的液滴)可以以基本上常规的流动模式(例如,以常规流速)沿着通道流动。这种常规的流动模式可以允许形成使得包括单个珠粒和单个生物颗粒的液滴。这种常规的流动模式可以允许液滴具有大于5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%的占据率(例如,具有珠粒和生物颗粒的液滴)。在例如美国专利公开号2015/0292988中提供了这种常规流动模式和可用于提供这种常规流动模式的装置,所述专利以全文引用方式并入本文。第二流体218可包含油,例如氟化油,其包括用于稳定所得液滴(例如,抑制所得液滴220的后续聚结)的含氟表面活性剂。产生的离散液滴可包括单独的生物颗粒216。产生的离散液滴可包括包含条形码或其他试剂的珠粒214。例如,珠粒214可包含多个核酸条形码分子,每个核酸条形码分子包含共同的条形码序列。产生的离散液滴可以包括单独的生物颗粒和携带条形码的珠粒,例如液滴220。在一些情况下,离散液滴可以包括多于一个单独的生物颗粒或不包括生物颗粒。在一些情况下,离散液滴可包括多于一个珠粒或不包括珠粒。离散液滴可能未被占据(例如,没有珠粒、没有生物颗粒)。有利地,分配生物颗粒和携带条形码的珠粒的离散液滴可以有效地允许将条形码归属于分配区内的生物颗粒的大分子组分。分配区的内容物可能保持与其他分配区的内容物离散。如将理解的,本文描述的通道区段可以联接到多种不同流体源或接收部件中的任一个,包括其他系统的贮存器、管道、歧管或流体部件。如将理解的,微流体通道结构200可具有其他几何形状。例如,微流体通道结构可具有多于一个通道汇合点。例如,微流体通道结构可以具有2、3、4或5个通道区段,每个通道区段携带在通道汇合点处相遇的珠粒。可以通过一个或多个流体流动单元引导流体沿着一个或多个通道或贮存器流动。流体流动单元可包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。还可以或以其他方式通过施加的压力差、离心力、电动泵送、真空、毛细管或重力流等来控制流体。珠粒可以是多孔的、无孔的、固体的、半固体的、半流体的、流体的和/或其组合。在一些情况下,珠粒可以是可溶解的、可破坏的和/或可降解的。在一些情况下,珠粒可以是不可降解的。在一些情况下,珠粒可以是凝胶珠粒。凝胶珠粒可以是水凝胶珠粒。凝胶珠粒可以由分子前体形成,例如聚合物或单体物质。半固体珠粒可以是脂质体珠粒。固体珠粒可包含金属,包括氧化铁、金和银。在一些情况下,珠粒可以是二氧化硅珠粒。在一些情况下,珠粒可以是刚性的。在其他情况下,珠粒可以是柔性的和/或可压缩的。珠粒可具有任何合适的形状。珠粒形状的实例包括但不限于球形、非球形、椭圆形、长圆形、无定形、圆形、圆柱形及其变型形式。珠粒可具有均匀尺寸或不均匀尺寸。在一些情况下,珠粒的直径可以是至少约10纳米(nm)、100nm、500nm、1微米(μm)、5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、250μm、500μm、1mm或更大。在一些情况下,珠粒的直径可小于约10nm、100nm、500nm、1μm、5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、250μm、500μm、1mm或更小。在一些情况下,珠粒的直径可以在约40-75μm、30-75μm、20-75μm、40-85μm、40-95μm、20-100μm、10-100μm、1-100μm、20-250μm或20-500μm的范围内。在某些方面中,珠粒可以以具有相对单分散尺寸分布的珠粒群体或多个珠粒提供。在需要在分配区内提供相对一致量的试剂的情况下,保持相对一致的珠粒特性(例如尺寸)可有助于整体一致性。特别地,本文所述的珠粒可具有其横截面尺寸的变异系数小于50%、小于40%、小于30%、小于20%,并且在一些情况下小于15%、小于10%、小于5%或更小的尺寸分布。珠粒可包含天然和/或合成材料。例如,珠粒可包含天然聚合物、合成聚合物或天然和合成聚合物。天然聚合物的实例包括蛋白质和糖,例如脱氧核糖核酸、橡胶、纤维素、淀粉(例如,直链淀粉、支链淀粉)、蛋白质、酶、多糖、丝、聚羟基链烷酸酯、壳聚糖、葡聚糖、胶原、角叉菜胶、卵叶车前子、阿拉伯胶、琼脂、明胶、虫胶、梧桐树胶、黄原胶、玉米糖胶、瓜尔胶、刺梧桐树胶、琼脂糖、海藻酸、藻酸盐或其天然聚合物。合成聚合物的实例包括丙烯酸类、尼龙、硅氧烷、氨纶、粘胶人造丝、多元羧酸、聚乙酸乙烯酯、聚丙烯酰胺、聚丙烯酸酯、聚乙二醇、聚氨酯、聚乳酸、二氧化硅、聚苯乙烯、聚丙烯腈、聚丁二烯、聚碳酸酯、聚乙烯、聚对苯二甲酸乙二醇酯、聚(三氟氯乙烯)、聚(环氧乙烷)、聚(对苯二甲酸乙二醇酯)、聚乙烯、聚异丁烯、聚(甲基丙烯酸甲酯)、聚(甲醛)、聚甲醛、聚丙烯、聚苯乙烯、聚(四氟乙烯)、聚(乙酸乙烯酯)、聚(乙烯醇)、聚(氯乙烯)、聚(偏二氯乙烯)、聚(偏二氟乙烯)、聚(氟乙烯)和/或其组合(例如,共聚物)。珠粒也可以由除聚合物之外的材料形成,包括脂质、胶束、陶瓷、玻璃陶瓷、材料复合物、金属、其他无机材料等。在一些情况下,珠粒可含有分子前体(例如,单体或聚合物),其可通过分子前体的聚合形成聚合物网络。在一些情况下,前体可以是已经聚合的物质,其能够通过例如化学交联进行进一步的聚合。在一些情况下,前体可包含丙烯酰胺或甲基丙烯酰胺单体、低聚物或聚合物中的一种或多种。在一些情况下,珠粒可包含预聚物,其是能够进一步聚合的低聚物。例如,可以使用预聚物制备聚氨酯珠粒。在一些情况下,珠粒可含有可进一步聚合在一起的单独聚合物。在一些情况下,可以通过不同前体的聚合产生珠粒,使得它们包含混合聚合物、共聚物和/或嵌段共聚物。在一些情况下,珠粒可在聚合物前体(例如,单体、低聚物、线性聚合物)、核酸分子(例如,寡核苷酸)、引物和其他实体之间包含共价键或离子键。在一些情况下,共价键可以是碳-碳键、硫醚键或碳-杂原子键。交联可以是永久的或可逆的,这取决于所用的特定交联剂。可逆交联可允许聚合物在适当条件下线性化或解离。在一些情况下,可逆交联还可以允许结合物质可逆地附接于珠粒表面。在一些情况下,交联剂可形成二硫键。在一些情况下,形成二硫键的化学交联剂可以是胱胺或改性的胱胺。在一些情况下,二硫键可以在掺入珠粒的分子前体单元(例如,单体、低聚物或线性聚合物)或前体与核酸分子(例如,寡核苷酸)之间形成。例如,胱胺(包括改性的胱胺)是包含二硫键的有机试剂,其可以用作珠粒的单独单体或聚合物前体之间的交联剂。聚丙烯酰胺可以在胱胺或包含胱胺(例如,改性的胱胺)的物质存在下聚合,以产生包含二硫键的聚丙烯酰胺凝胶珠粒(例如,包含可化学还原的交联剂的可化学降解的珠粒)。二硫键可以允许在珠粒暴露于还原剂时使珠粒降解(或溶解)。在一些情况下,壳聚糖(线性多糖聚合物)可以通过亲水链与戊二醛交联以形成珠粒。壳聚糖聚合物的交联可以通过由热、压力、ph变化和/或辐射引发的化学反应来实现。在一些情况下,珠粒可包含acrydite部分,其在某些方面可用于将一个或多个核酸分子(例如,条形码序列、条形码化核酸分子、条形码化寡核苷酸、引物或其他寡核苷酸)附接到珠粒。在一些情况下,acrydite部分可以指由acrydite与一种或多种物质的反应例如acrydite与其他单体和交联剂在聚合反应期间的反应所产生的acrydite类似物。可以修饰acrydite部分以与待附接的物质形成化学键,例如核酸分子(例如条形码序列、条形码化核酸分子、条形码化寡核苷酸、引物或其他寡核苷酸)。acrydite部分可以用能够形成二硫键的硫醇基团改性,或者可以用已经包含二硫键的基团改性。硫醇或二硫化物(通过二硫化物交换)可以用作待附接物质的锚点,或者acrydite部分的另一部分可以用于附接。在一些情况下,附接可以是可逆的,使得当二硫键断裂时(例如,在还原剂存在下),附接的物质从珠粒中释放出来。在其他情况下,acrydite部分可包含可用于附接的反应性羟基。用于附接核酸分子(例如,寡核苷酸)的珠粒的官能化可以通过多种不同方法实现,包括活化聚合物内的化学基团、将活性或可活化的官能团掺入聚合物结构中或者在珠粒生产中的预聚物或单体阶段进行附接。例如,聚合以形成珠粒的前体(例如单体、交联剂)可包含acrydite部分,使得当产生珠粒时,珠粒还包含acrydite部分。所述acrydite部分可以附接于核酸分子(例如,寡核苷酸),其可以包括引发序列(例如,用于扩增靶核酸的引物、随机引物、用于信使rna的引物序列)和/或一个或多个条形码序列。一个或多个条形码序列可以包括对于与给定珠粒偶合的所有核酸分子(例如,核酸条形码分子)相同的序列和/或对于与给定珠粒偶合的所有核酸分子不同的序列。核酸分子可以掺入珠粒中和/或可以附接到珠粒的表面上。在一些情况下,核酸分子(例如,核酸条形码分子)可以包含例如用于附接于测序流动池的功能序列,例如用于测序的p5序列。在一些情况下,核酸分子(例如,核酸条形码分子)或其衍生物(例如,由核酸分子产生的寡核苷酸或多核苷酸)可以包含另一种功能序列,例如像用于附接于测序流动池以用于illumina测序的p7序列。在一些情况下,核酸分子可包含条形码序列。在一些情况下,引物可进一步包含独特分子标识符(umi)。在一些情况下,引物可包含用于illumina测序的r1引物序列。在一些情况下,引物可包含用于illumina测序的r2引物序列。可以与本公开的组合物、装置、方法和系统一起使用的此类核酸分子(例如,寡核苷酸、多核苷酸等)及其用途的实例提供于美国专利公开号2014/0378345和2015/0376609中,所述专利各自以全文引用方式并入本文。图8说明了携带条形码的珠粒的实例。核酸分子802(例如寡核苷酸)可以通过可释放键806(例如像二硫化物接头)偶合到珠粒804。相同的珠粒804可以偶合到一个或多个其他核酸分子818、820(例如,通过可释放键)。核酸分子802可以是条形码或包含条形码。如本文其他地方所述,条形码的结构可包括许多序列元素。核酸分子802可包含可用于后续处理的功能序列808。例如,功能序列808可以包括测序仪特异性流动池附接序列(例如,用于测序系统的p5序列)和测序引物序列(例如用于测序系统的r1引物)中的一种或多种。核酸分子802可包含用于条形码化样品(例如dna、rna、蛋白质等)的条形码序列810。在一些情况下,条形码序列810可以是珠粒特异性的,使得条形码序列810对于与相同珠粒804偶合的所有核酸分子(例如,包括核酸分子802)是共用的。可替代地或另外地,条形码序列810可以是分配区特异性的,使得条形码序列810对于与分配到相同分配区中的一个或多个珠粒偶合的所有核酸分子是共用的。核酸分子802可包含特异性引发序列812,例如mrna特异性引发序列(例如,聚-t序列)、靶向引发序列和/或随机引发序列。核酸分子802可以包含锚定序列814以确保特异性引发序列812在(例如mrna的)序列末端杂交。例如,锚定序列814可以包括随机的短核苷酸序列,例如1-聚体(mer)、2-聚体、3-聚体或更长的序列,其可以确保聚-t区段更可能在mrna的聚-a尾的序列末端杂交。核酸分子802可包含独特分子识别序列816(例如,独特分子标识符(umi))。在一些情况下,独特分子识别序列816可包含约5至约8个核苷酸。替代地,独特分子识别序列816可压缩少于约5个或多于约8个核苷酸。独特分子识别序列816可以是在与单个珠粒(例如,珠粒804)偶合的单独核酸分子(例如,802、818、820等)之间变化的独特序列。在一些情况下,独特分子识别序列816可以是随机序列(例如像随机n-聚体序列)。例如,umi可以提供被捕获的起始mrna分子的独特标识符,以允许定量原始表达的rna的数量。可以理解,尽管图8显示了与珠粒804的表面偶合的三个核酸分子802、818、820,但是单独珠粒可以与任何数量的单独核酸分子偶合,例如,一个到数十个到数千个甚至数百万个单独核酸分子。单独核酸分子的相应条形码可在与相同珠粒偶合的不同单独核酸分子之间包含共同序列区段或相对共同序列区段(例如,808、810、812等)和可变或独特序列区段(例如,816)。在操作中,生物颗粒(例如,细胞、dna、rna等)可以连同携带条形码的珠粒804共同分配。条形码化核酸分子802、818、820可以在分配区中从珠粒804中释放。举例来说,在分析样品rna的上下文中,释放的核酸分子中的一个(例如,802)的聚-t区段(例如,812)可以与mrna分子的聚-a尾杂交。逆转录可以产生mrna的cdna转录物,但是所述转录物包括核酸分子802的每个序列区段808、810、816。因为核酸分子802包含锚定序列814,所以更可能与mrna的聚-a尾杂交并引发在mrna的聚-a尾的序列末端处的逆转录。在任何给定的分配区内,单独mrna分子的所有cdna转录物可以包括共同条形码序列区段810。然而,由给定分配区内的不同mrna分子制备的转录物可以在独特分子识别序列812区段(例如,umi区段)处有所不同。有利地,即使在任何随后扩增给定分配区的内容物之后,不同umi的数量也可以指示源自给定分配区并因此源自生物颗粒(例如,细胞)的mrna的量。如上所述,可以对转录物进行扩增、清除和测序以识别mrna的cdna转录物的序列,以及对条形码区段和umi区段进行测序。虽然描述了聚-t引物序列,但其他靶向或随机引发序列也可用于引发逆转录反应。同样地,尽管描述为将条形码化寡核苷酸释放到分配区中,但在一些情况下,与珠粒(例如,凝胶珠粒)结合的核酸分子可用于杂交并捕获珠粒固相上的mrna,例如,以促进rna与其他细胞内容物的分离。在一些情况下,包含反应性或能够被活化以使其变得具有反应性的官能团的前体可以与其他前体聚合以产生包含活化或可活化官能团的凝胶珠粒。然后可以使用官能团以将另外的物质(例如,二硫化物接头、引物、其他寡核苷酸等)附接到凝胶珠粒上。例如,包含羧酸(cooh)基团的一些前体可与其他前体共聚合以形成还包含cooh官能团的凝胶珠粒。在一些情况下,丙烯酸(包含游离cooh基团的物质)、丙烯酰胺和双(丙烯酰基)胱胺可以共聚在一起以产生包含游离cooh基团的凝胶珠粒。凝胶珠粒的cooh基团可以被活化(例如,通过1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(edc)和n-羟基琥珀酰亚胺(nhs)或4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉氯化物(dmtmm))使得它们是反应性的(例如,与其中edc/nhs或dmtmm用于活化的胺官能团反应)。然后,活化的cooh基团可以与适当的物质(例如,包含胺官能团的物质,其中羧酸基团被活化以与胺官能团反应)反应,所述物质包含与珠粒连接的部分。在其聚合物网络中包含二硫键的珠粒可以通过将一些二硫键还原成游离硫醇来用另外的物质官能化。二硫键可以通过例如还原剂(例如dtt、tcep等)的作用来还原以产生游离的硫醇基团,而不溶解珠粒。然后珠粒的游离硫醇可以与物质的游离硫醇或包含另一个二硫键的物质(例如,通过硫醇-二硫化物交换)反应,使得物质可以与珠粒连接(例如,通过产生的二硫键)。在一些情况下,珠粒的游离硫醇可与任何其他合适的基团反应。例如,珠粒的游离硫醇可与包含acrydite部分的物质反应。珠粒的游离硫醇基团可通过迈克尔加成化学与acrydite反应,使得包含acrydite的物质与珠粒连接。在一些情况下,可以通过包含硫醇加帽剂如n-乙基马来酰胺或碘乙酸酯防止不受控制的反应。可以控制珠粒内二硫键的活化,使得仅活化少量二硫键。例如,可以通过控制用于产生游离硫醇基团的还原剂的浓度和/或用于在珠聚合中形成二硫键的试剂的浓度来进行控制。在一些情况下,低浓度(例如,还原剂分子:凝胶珠粒比率小于或等于约1:100,000,000,000、小于或等于约1:10,000,000,000、小于或等于约1:1,000,000,000、小于或等于约1:100,000,000、小于或等于约1:10,000,000、小于或等于约1:1,000,000、小于或等于约1:100,000、小于或等于约1:10,000)还原剂可用于还原。控制还原成游离硫醇的二硫键的数量可用于确保官能化期间的珠粒结构完整性。在一些情况下,光学活性剂(例如荧光染料)可以通过珠粒的游离硫醇基团与珠粒偶合,并用于定量珠粒中存在的游离硫醇的数量和/或追踪珠粒。在一些情况下,在凝胶珠粒形成后向凝胶珠粒中添加部分可能是有利的。例如,在凝胶珠粒形成后添加寡核苷酸(例如,条形码化寡核苷酸)可以避免在聚合期间可能发生的链转移终止期间物质的损失。此外,较小的前体(例如,不包含侧链基团和连接部分的单体或交联剂)可以用于聚合,并且由于粘滞效应可以最小程度地阻碍链端生长。在一些情况下,凝胶珠粒合成后的官能化可以使要负载的物质(例如,寡核苷酸)暴露于潜在的破坏剂(例如,自由基)和/或化学环境最小化。在一些情况下,所产生的凝胶可具有最高临界共溶温度(ucst),其可允许珠粒的温度驱使的溶胀和塌陷。在随后用寡核苷酸官能化珠粒期间,这种官能团可以有助于寡核苷酸(例如,引物)渗入珠粒中。制备后官能化也可用于控制珠粒中物质的负载比率,使得例如负载比率的可变性最小化。物质负载也可以在分批过程中执行,使得多个珠粒可以在一批中用物质官能化。注射或以其他方式引入到分配区中的珠粒可包括可释放、可裂解或可逆附接的条形码。注射或以其他方式引入到分配区中的珠粒可包括可活化的条形码。注射或以其他方式引入到分配区中的珠粒可以是可降解的、可破裂的或可溶解的珠粒。条形码可以可释放地、可裂解地或可逆地附接到珠粒,使得条形码可以通过裂解条形码分子与珠粒之间的连接而释放或为可释放的,或者通过下面的珠粒自身的降解释放,从而允许条形码被其他试剂接近或可被其他试剂接近,或两者兼而有之。在非限制性实例中,可以通过还原二硫键、使用限制酶、光活化裂解或通过其他类型的刺激(例如,化学、热、ph、酶等)和/或反应进行裂解来实现,例如本文其他地方所述。可释放的条形码有时可被称为可活化的,因为它们一旦释放就可用于反应。因此,例如,可通过从珠粒(或本文所述的其他合适类型的分配区)释放条形码来活化可活化的条形码。在所描述的方法和系统的上下文中也设想了其他可活化的配置。除了珠粒与缔合分子(例如含有条形码的核酸分子(例如条形码化寡核苷酸))之间的可裂解键之外或作为其替代,珠粒可以在自发地或在暴露于一种或多种刺激(例如,温度变化、ph变化、暴露于特定化学物质或相、暴露于光、还原剂等)时为可降解、可破坏或可溶解的。在一些情况下,珠粒可以是可溶解的,使得珠粒的材料组分在暴露于特定化学物质或环境变化(例如变化温度或ph变化)时溶解。在一些情况下,凝胶珠粒可以在升高的温度和/或碱性条件下降解或溶解。在一些情况下,珠粒可以是可热降解的,使得当珠粒暴露于适当的温度变化(例如,加热)时,珠粒降解。与物质(例如,核酸分子,例如条形码化寡核苷酸)结合的珠粒的降解或溶解可导致物质从珠粒中释放。从以上公开内容可以理解,珠粒的降解可以指在使物理珠粒本身的结构发生和不发生降解的情况下结合或夹带的物质从珠粒中解离。例如,珠粒的降解可以涉及通过本文其他地方描述的一种或多种物质和/或方法裂解可裂解键。在另一个实例中,可以通过例如由改变化学环境引起的渗透压差从珠粒中释放夹带的物质。举例来说,由渗透压差引起的珠粒孔径的改变通常可以在珠粒本身的结构没有降解的情况下发生。在一些情况下,由珠粒的渗透溶胀引起的孔径增加可以允许珠粒内的夹带物质的释放。在其他情况下,由于孔径收缩,珠粒的渗透收缩可能使珠粒更好地保留夹带物质。可以将可降解的珠粒引入到分配区(例如乳液的液滴或孔)中,使得珠粒在分配区内降解,并且当施加适当的刺激时,任何缔合的物质(例如,寡核苷酸)在液滴内释放。游离物质(例如,寡核苷酸、核酸分子)可以与分配区中包含的其他试剂相互作用。例如,包含胱胺并通过二硫键与条形码序列连接的聚丙烯酰胺珠粒可以与油包水乳液的液滴中的还原剂组合。在液滴内,还原剂可以破坏各种二硫键,导致珠粒降解并将条形码序列释放到液滴的含水内部环境中。在另一个实例中,加热在碱性溶液中包含结合珠粒的条形码序列的液滴也可导致珠粒降解并将附接的条形码序列释放到液滴的含水内部环境中。任何合适数量的分子标签分子(例如,引物、条形码化寡核苷酸)可以与珠粒缔合,使得在从珠粒中释放时,分子标签分子(例如,引物,例如,条形码化寡核苷酸)以预先定义的浓度存在于分配区中。可以选择这种预先定义的浓度以促进用于在分配区内产生测序文库的某些反应(例如扩增)。在一些情况下,引物的预先定义的浓度可以通过产生携带核酸分子(例如,寡核苷酸)的珠粒的过程来限制。在一些情况下,珠粒可以非共价地负载有一种或多种试剂。珠粒可以通过例如使珠粒经受足以使珠粒溶胀的条件,使试剂有足够的时间扩散到珠粒的内部,并使珠粒经受足以使珠粒去溶胀的条件来非共价负载。例如,可以通过将珠粒置于热力学上有利的溶剂中,使珠粒经受较高或较低的温度,使珠粒经受较高或较低的离子浓度,和/或使珠粒经受电场来实现珠粒的溶胀。珠粒的溶胀可以通过各种溶胀方法来实现。珠粒的去溶胀可以通过例如将珠粒转移到热力学上不利的溶剂中,使珠粒经受较低或较高温度,使珠粒经受较低或较高的离子浓度,和/或除去电场来实现。珠粒的去溶胀可以通过各种去溶胀方法来实现。转移珠粒可能导致珠粒中的孔收缩。然后收缩可能阻碍珠粒内的试剂从珠粒的内部扩散出来。阻碍可能是由于试剂与珠粒内部之间的空间相互作用。转移可以以微流体方式完成。例如,转移可以通过将珠粒从一种共流动的溶剂流移动到不同的共流动的溶剂流中来实现。珠粒的溶胀性和/或孔径可通过改变珠粒的聚合物组成来调节。在一些情况下,与前体连接的acrydite部分、与前体连接的另一种物质或前体本身可包含不稳定键,例如化学、热或光敏感键,例如二硫键、uv敏感键等。一旦acrydite部分或包含不稳定键的其他部分被掺入珠粒中,珠粒也可包含不稳定键。例如,不稳定键可例如用于将物质(例如,条形码、引物等)可逆地连接(例如,共价连接)到珠粒上。在一些情况下,热不稳定键可以包括基于核酸杂交的附接,例如,在寡核苷酸与附接于珠粒的互补序列杂交的情况下,使得杂合体的热解链(melting)将寡核苷酸(例如含有条形码的序列)从珠粒或微胶囊中释放出来。向凝胶珠粒中添加多种类型的不稳定键可导致产生能够对变化的刺激有反应的珠粒。每种类型的不稳定键可能对相关的刺激(例如,化学刺激、光、温度、酶等)敏感,使得通过每个不稳定键附接到珠粒上的物质的释放可以通过施加适当的刺激来控制。这种官能团可用于从凝胶珠粒中受控地释放物质。在一些情况下,包含不稳定键的另一物质可以在凝胶珠粒形成后通过例如如上所述的凝胶珠粒的活化官能团与凝胶珠粒连接。可以理解,可释放地、可裂解地或可逆地附接到本文所述珠粒上的条形码包括通过裂解条形码分子与珠粒之间的键来释放或为可释放的条形码,或通过下面的珠粒本身的降解来释放的条形码,从而允许条形码被其他试剂接近或可被其他试剂接近,或两者兼而有之。如本文所述可释放的条形码有时可被称为可活化的,因为它们一旦释放就可用于反应。因此,例如,可通过从珠粒(或本文所述的其他合适类型的分配区)释放条形码来活化可活化的条形码。在所描述的方法和系统的上下文中也设想了其他可活化的配置。除了可热裂解的键、二硫键和uv敏感键之外,可以与前体或珠粒偶合的不稳定键的其他非限制性实例包括酯键(例如,可用酸、碱或羟胺裂解)、邻位二醇键(例如,可通过高碘酸钠裂解)、狄尔斯-阿尔德(diels-alder)键(例如,可通过热裂解)、砜键(例如,可通过碱裂解)、甲硅烷基醚键(例如,可通过酸裂解)、糖苷键(例如,可通过淀粉酶裂解)、肽键(例如,可通过蛋白酶裂解)或磷酸二酯键(例如,可通过核酸酶(例如,dna酶)裂解))。键可以通过其他核酸分子靶向酶裂解,例如限制酶(例如限制性内切核酸酶),如下文进一步描述的。在珠粒产生期间(例如,在前体聚合期间),可以将物质包封在珠粒中。这些物质可能参与或可能不参与聚合。这些物质可以进入聚合反应混合物中,使得生成的珠粒在珠粒形成时包含物质。在一些情况下,可在形成后将这些物质加入凝胶珠粒中。这些物质可包括,例如,核酸分子(例如,寡核苷酸)、用于核酸扩增反应的试剂(例如,引物、聚合酶、dntp、辅因子(例如,离子辅因子)、缓冲液)包括文中所述的那些、用于酶促反应的试剂(例如,酶、辅因子、底物、缓冲液)、用于核酸修饰反应的试剂(例如聚合、连接或消化)和/或用于一种或多种测序平台的模板制备(例如,标记)的试剂(例如,用于的)。这些物质可包括一种或多种本文所述的酶,包括但不限于聚合酶、逆转录酶、限制酶(例如内切核酸酶)、转座酶、连接酶、蛋白酶k、dna酶等。这些物质可包括本文其他地方所述的一种或多种试剂(例如,裂解剂、抑制剂、灭活剂、螯合剂、刺激物)。这些物质的捕集可以通过在前体聚合期间产生的聚合物网络密度、控制凝胶珠粒内的离子电荷(例如,通过与聚合物质连接的离子物质)或通过释放其他物质来控制。在珠粒降解时和/或通过施加能够从珠粒释放物质的刺激,可以从珠粒释放包封的物质。可替代地或另外地,物质可在分配区形成期间或之后在分配区(例如,液滴)中分配。这些物质可以包括但不限于也可以包封在珠粒中的上述物质。可降解珠粒可包含一种或多种具有不稳定键的物质,使得当珠粒/物质暴露于适当的刺激时,键断裂并且珠粒降解。不稳定键可以是化学键(例如,共价键、离子键)或可以是另一种类型的物理相互作用(例如,范德华相互作用、偶极-偶极相互作用等)。在一些情况下,用于产生珠粒的交联剂可包含不稳定键。在暴露于适当的条件时,不稳定键可以断裂并且珠粒降解。例如,当将包含胱胺交联剂的聚丙烯酰胺凝胶珠粒暴露于还原剂时,胱胺的二硫键可以断裂并且珠粒降解。与不降解的珠粒相比,当将适当的刺激施加到珠粒上时,可降解的珠粒可用于更快地从珠粒释放附接的物质(例如,核酸分子、条形码序列、引物等)。例如,对于与多孔珠粒的内表面结合的物质或在包封物质的情况下,物质在珠粒降解时可具有较大迁移率和溶液中的其他物质的可接近性。在一些情况下,物质也可以通过可降解的接头(例如,二硫化物接头)附接于可降解的珠粒。可降解的接头可以对与可降解珠粒相同的刺激有反应,或者两种可降解物质可以对不同的刺激有反应。例如,条形码序列可以通过二硫键附接到包含胱胺的聚丙烯酰胺珠粒上。在条形码化珠粒暴露于还原剂时,珠粒降解并且条形码序列在条形码序列与珠粒之间的二硫键断裂以及珠粒中胱胺的二硫键断裂时释放。从以上公开内容可以理解,虽然被称为珠粒的降解,但在如上所述的许多情况下,所述降解可以指在使物理珠粒本身的结构发生和不发生降解的情况下结合或夹带的物质从珠粒中解离。例如,可以通过例如由改变化学环境引起的渗透压差从珠粒中释放夹带的物质。举例来说,由渗透压差引起的珠粒孔径的改变通常可以在珠粒本身的结构没有降解的情况下发生。在一些情况下,由珠粒的渗透溶胀引起的孔径增加可以允许珠粒内的夹带物质的释放。在其他情况下,由于孔径收缩,珠粒的渗透收缩可能使珠粒更好地保留夹带物质。在提供可降解珠粒的情况下,避免将这些珠粒在给定时间之前暴露于引起这种降解的一个或多个刺激可能是有益的,以便例如避免过早的珠粒降解和由此降解引起的问题,包括例如不良的流动特性和聚集。举例来说,当珠粒包含可还原的交联基团(例如二硫化物基团)时,期望避免使这些珠粒与还原剂如dtt或其他二硫化物裂解试剂接触。在这种情况下,对本文所述珠粒的处理在一些情况下将不含还原剂如dtt。因为通常在商业酶制剂中提供还原剂,所以可能期望在处理本文所述的珠粒时提供不含还原剂(或不含dtt)的酶制剂。此类酶的实例包括例如聚合酶制剂、逆转录酶制剂、连接酶制剂、以及可用于处理本文所述珠粒的许多其他酶制剂。术语“不含还原剂”或“不含dtt”的制剂可以指对于用于降解这些珠粒的这些材料而言具有小于约1/10、小于约1/50、或甚至小于约1/100的较低范围的制剂。例如,对于dtt,不含还原剂的制剂可具有小于约0.01毫摩尔(mm)、0.005mm、0.001mmdtt、0.0005mmdtt、或甚至小于约0.0001mmdtt。在许多情况下,dtt的量可能无法检测到。可以使用许多化学触发剂来触发珠粒的降解。这些化学变化的实例可包括但不限于ph介导的珠粒内组分完整性的改变、珠粒的组分通过裂解交联键的降解以及珠粒组分的解聚。在一些实施方案中,珠粒可以由包含可降解化学交联剂(例如bac或胱胺)的材料形成。这种可降解交联剂的降解可通过许多机制完成。在一些实例中,珠粒可以与诱导氧化、还原或其他化学变化的化学降解剂接触。例如,化学降解剂可以是还原剂,例如二硫苏糖醇(dtt)。还原剂的其他实例可包括β-巯基乙醇、(2s)-2-氨基-1,4-二巯基丁烷(二硫代丁胺或dtba)、三(2-羧乙基)膦(tcep)或其组合。还原剂可降解在形成珠粒的凝胶前体之间形成的二硫键,从而降解珠粒。在其他情况下,溶液的ph变化(例如ph的增加)可能触发珠粒的降解。在其他情况下,暴露于含水溶液(例如水)可能触发水解降解,并且因此触发珠粒的降解。在一些情况下,刺激的任何组合可以触发珠粒的降解。例如,ph的变化可使化学试剂(例如dtt)能够成为有效的还原剂。还可以在施加热刺激时诱导珠粒释放其内容物。温度的变化会导致珠粒的多种变化。例如,热可导致固体珠粒液化。热的变化可能导致珠粒解链,使得珠粒的一部分降解。在其他情况下,热可能增加珠粒组分的内部压力,使得珠粒破裂或爆炸。热还可以作用于用作构建珠粒的材料的热敏聚合物。任何合适的试剂可使珠粒降解。在一些实施方案中,温度或ph的变化可用于降解珠粒内的热敏感性或ph敏感性键。在一些实施方案中,化学降解剂可用于通过氧化、还原或其他化学变化使珠粒内的化学键降解。例如,化学降解剂可以是还原剂,例如dtt,其中dtt可以使交联剂与凝胶前体之间形成的二硫键降解,从而使珠粒降解。在一些实施方案中,可以添加还原剂以使珠粒降解,所述还原剂可以使珠粒释放或不释放其内容物。还原剂的实例可包括二硫苏糖醇(dtt)、β-巯基乙醇、(2s)-2-氨基-1,4-二巯基丁烷(二硫代丁胺或dtba)、三(2-羧乙基)膦(tcep)或其组合。还原剂可以以约0.1mm、0.5mm、1mm、5mm、10mm的浓度存在。还原剂可以以至少约0.1mm、0.5mm、1mm、5mm、10mm或大于10mm的浓度存在。还原剂可以以至多约10mm、5mm、1mm、0.5mm、0.1mm或更低的浓度存在。任何合适数量的分子标签分子(例如,引物、条形码化寡核苷酸)可以与珠粒缔合,使得在从珠粒中释放时,分子标签分子(例如,引物,例如,条形码化寡核苷酸)以预先定义的浓度存在于分配区中。可以选择这种预先定义的浓度以促进用于在分配区内产生测序文库的某些反应(例如扩增)。在一些情况下,引物的预先定义的浓度可以通过产生携带寡核苷酸的珠粒的过程来限制。尽管以上已经就提供基本上单独占据的分配区描述了图1和图2,但在某些情况下,可能希望提供例如包含两个、三个、四个或更多个细胞的多占分配区和/或在单个分配区内包括条形码化核酸分子(例如,寡核苷酸)的微胶囊(例如珠粒)。因此,如上所述,可以控制含有生物颗粒和/或珠粒的流体和分配流体的流动特性,以提供这种多占分配区。特别地,可以控制流动参数以提供大于约50%、大于约75%、并且在一些情况下大于约80%、90%、95%或更高的分配区的给定占据率。在一些情况下,可以使用另外的微胶囊以将额外的试剂递送到分配区。在这种情况下,从不同的珠粒源(例如,包含不同的缔合试剂)通过不同的通道入口进入公共通道或液滴产生汇合点(例如,汇合点210)将不同的珠粒引入这样的公共通道或液滴产生汇合点可能是有利的。在这种情况下,可以控制不同珠粒进入通道或汇合点的流动和频率,以提供来自每个源的一定比率的微胶囊,同时确保到分配区中的这些珠粒与给定数量的生物颗粒的给定配对或组合(例如,每个分配区一个生物颗粒和一个珠粒)。本文所述的分配区可包括小体积,例如,小于约10微升(μl)、900皮升(pl)、800pl、700pl、600pl、500pl、400pl、300pl、200pl、100pl、50pl、20pl、10pl、1pl、500纳升(nl)、100nl、50nl或更低。例如,在基于液滴的分配区的情况下,液滴可具有小于约1000pl、900pl、800pl、700pl、600pl、500pl、400pl、300pl、200pl、100pl、50pl、20pl、10pl、1pl或更少的总体积。在与微胶囊共分配的情况下,应当理解,分配区内的样品流体体积(例如包括共分配的生物颗粒和/或珠粒)可小于上述体积的约90%、小于约80%、小于约70%、小于约60%、小于约50%、小于约40%、小于约30%、小于约20%、或小于上述体积的约10%。图49显示约1,000pl液滴相对于较小的约400pl液滴的示例性参数。在一些情况下,使用较小的液滴尺寸可能导致泊松推导的细胞双峰速率降低。使用较小的液滴尺寸也可导致细胞通量增加约2倍。如本文其他地方所述,分配物质可以产生分配区群体或多个分配区。在这种情况下,可以产生或以其他方式提供任何合适数量的分配区。例如,可以产生或以其他方式提供至少约1,000个分配区、至少约5,000个分配区、至少约10,000个分配区、至少约50,000个分配区、至少约100,000个分配区、至少约500,000个分配区、至少约1,000,000个分配区、至少约5,000,000个分配区、至少约10,000,000个分配区、至少约50,000,000个分配区、至少约100,000,000个分配区、至少约500,000,000个分配区、至少约1,000,000,000个分配区或更多分配区。此外,多个分配区可以包括未占据的分配区(例如,空分配区)和占据的分配区。试剂根据某些方面,生物颗粒可以连同裂解试剂一起分配,以释放分配区内的生物颗粒的内容物。在这种情况下,裂解剂可以在将生物颗粒例如通过通道汇合点上游的另外通道或多个通道引入分配汇合点/液滴产生区(例如,汇合点210)的同时或就在其之前与生物颗粒悬浮液接触。根据其他方面,额外地或替代地,生物颗粒可以连同其他试剂一起分配,如下面将进一步描述的。图3显示了用于共分配生物颗粒和试剂的微流体通道结构300的实例。通道结构300可包括通道区段301、302、304、306和308。通道区段301和302在第一通道汇合点309处连通。通道区段302、304、306和308在第二通道汇合点310处连通。在示例性操作中,通道区段301可以将包括多个生物颗粒314的含水流体312沿着通道区段301输送到第二汇合点310中。作为替代或除此之外,通道区段301可以运输珠粒(例如,凝胶珠粒)。珠粒可包含条形码分子。例如,通道区段301可以连接到包括生物颗粒314的含水悬浮液的贮存器。在第二汇合点310的上游和就在达到其之前,通道区段301可以在第一汇合点309处与通道区段302相遇。通道区段302可以将悬浮在含水流体312中的多个试剂315(例如,裂解剂)沿着通道区段302输送到第一汇合点309中。例如,通道区段302可以连接到包含试剂315的贮存器。在第一汇合点309之后,通道区段301中的含水流体312可以将生物颗粒314和试剂315携带到第二汇合点310。在一些情况下,通道区段301中的含水流体312可包括一种或多种试剂,所述一种或多种试剂可以是与试剂315相同或不同的试剂。与含水流体312不混溶的第二流体316(例如,油)可从通道区段304和306中的每一个递送到第二汇合点310。在来自通道区段301的含水流体312与来自通道区段304和306中的每一个的第二流体316在第二通道汇合点310处相遇时,含水流体312可以在第二流体316中以离散液滴318的形式被分配并且沿着通道区段308从第二汇合点310流出。通道区段308可以将离散液滴318递送到流体联接到通道区段308的出口贮存器,在所述贮存器中将它们加以收集。第二流体316可包含油,例如氟化油,其包括用于稳定所得液滴(例如,抑制所得液滴318的后续聚结)的含氟表面活性剂。产生的离散液滴可以包括单独的生物颗粒314和/或一种或多种试剂315。在一些情况下,产生的离散液滴可以包括携带条形码的珠粒(未示出),例如通过本文其他地方描述的其他微流体结构。在一些情况下,离散液滴可能未被占据(例如,没有试剂、没有生物颗粒)。有利地,当裂解试剂和生物颗粒共分配时,裂解试剂可以促进分配区内生物颗粒的内容物的释放。分配区中释放的内容物可能保持与其他分配区的内容物离散。如将理解的,本文描述的通道区段可以联接到多种不同流体源或接收部件中的任一个,包括其他系统的贮存器、管道、歧管或流体部件。如将理解的,微流体通道结构300可具有其他几何形状。例如,微流体通道结构可具有多于两个通道汇合点。例如,微流体通道结构可以具有2、3、4、5个或更多个通道区段,每个通道区段携带在通道汇合点处相遇的相同或不同类型的珠粒、试剂和/或生物颗粒。可以控制每个通道区段中的流体流动以控制不同元素到液滴中的分配。可以通过一个或多个流体流动单元引导流体沿着一个或多个通道或贮存器流动。流体流动单元可包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。还可以或以其他方式通过施加的压力差、离心力、电动泵送、真空、毛细管或重力流等来控制流体。裂解剂的实例包括生物活性试剂,例如用于裂解不同细胞型(例如革兰氏阳性或阴性细菌、植物、酵母、哺乳动物等)的裂解酶,例如溶菌酶、无色肽酶、溶葡萄球菌素、labiase、kitalase、溶细胞酶和多种其他裂解酶,可从例如sigma-aldrich,inc.(stlouis,mo)购买,以及其他可商购的裂解酶。其他裂解剂可以额外地或替代地与生物颗粒共分配以引起生物颗粒内容物释放到分配区中。例如,在一些情况下,基于表面活性剂的裂解溶液可用于裂解细胞,但是这些可能不太适用于基于乳液的系统,在基于乳液的系统中表面活性剂可干扰稳定的乳液。在一些情况下,裂解溶液可包括非离子表面活性剂,例如像tritonx-100和tween20。在一些情况下,裂解溶液可包括离子表面活性剂,例如像,十二烷基肌氨酸钠和十二烷基硫酸钠(sds)。在某些情况下,也可以使用电穿孔、热、声学或机械细胞破坏,例如,基于非乳液的分配区如生物颗粒的包封可以补充或代替液滴分配区,其中在细胞破坏后,包封物的任何孔径足够小以保留给定大小的核酸片段。作为与上述生物颗粒共分配区的裂解剂的替代或补充,其他试剂也可以与生物颗粒共分配,包括例如dna酶和rna酶灭活剂或抑制剂(例如蛋白酶k)、螯合剂(例如edta)和用于去除或以其他方式降低不同细胞裂解物组分对核酸后续处理的负面活性或影响的其他试剂。另外,就包封的生物颗粒而言,可以将生物颗粒暴露于适当的刺激以从共分配的微胶囊中释放生物颗粒或其内容物。例如,在一些情况下,化学刺激可以连同包封的生物颗粒一起共分配,以允许微胶囊的降解和细胞或其内容物向更大的分配区中的释放。在一些情况下,所述刺激可以与本文其他地方描述的用于从其各自的微胶囊(例如珠粒)中释放核酸分子(例如,寡核苷酸)的刺激相同。在替代方面中,这可以是不同的且不重叠的刺激,以允许包封的生物颗粒在与核酸分子释放到相同分配区中不同的时间释放到分配区中。另外的试剂也可以与生物颗粒共分配,例如片段化生物颗粒的dna的内切核酸酶、dna聚合酶和用于扩增生物颗粒的核酸片段并将条形码分子标签附接到扩增片段的dntp。其他酶可以共分配,包括但不限于聚合酶、转座酶、连接酶、蛋白酶k、dna酶等。其他试剂还可以包括逆转录酶,包括具有末端转移酶活性的酶、引物和寡核苷酸、以及可用于模板转换的转换寡核苷酸(文中也称为“转换寡核苷酸”或“模板转换寡核苷酸”)。在一些情况下,模板转换可用于增加cdna的长度。在一些情况下,模板转换可用于将预先定义的核酸序列附加到cdna。在模板转换的实例中,cdna可以从模板(例如细胞mrna)的逆转录产生,其中具有末端转移酶活性的逆转录酶可以以模板非依赖性方式向cdna添加另外的核苷酸,例如聚c。转换寡核苷酸可包括与另外的核苷酸(例如聚c)互补的序列。cdna上的另外核苷酸(例如聚c)可以与转换寡核苷酸上的另外核苷酸(例如聚合g)杂交,由此转换寡核苷酸可以被逆转录酶用作模板以进一步延伸cdna。模板转换寡核苷酸可包含杂交区和模板区。杂交区可包含能够与靶杂交的任何序列。在一些情况下,如前所述,杂交区包含一系列与cdna分子3'末端的突出c碱基互补的g碱基。所述系列g碱基可包含1个g碱基、2个g碱基、3个g碱基、4个g碱基、5个g碱基或多于5个g碱基。模板序列可包含任何掺入cdna中的序列。在一些情况下,模板区包含至少1个(例如,至少2、3、4、5个或更多个)标签序列和/或功能序列。转换寡核苷酸可包含脱氧核糖核酸;核糖核酸;修饰的核酸包括2-氨基嘌呤、2,6-二氨基嘌呤(2-氨基-da)、倒置的dt、5-甲基dc、2'-脱氧肌苷、supert(5-羟基丁炔-2'-脱氧尿苷)、superg(8-氮杂-7-脱氮鸟苷)、锁定核酸(lna)、解锁核酸(una,例如una-a、una-u、una-c、una-g)、iso-dg、iso-dc、2'氟代碱基(例如,氟代c、氟代u、氟代a和氟代g)或任何组合。在一些情况下,转换寡核苷酸的长度可以是至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249或250个核苷酸或更长。在一些情况下,转换寡核苷酸的长度可以是至多约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249或250个核苷酸。一旦细胞的内容物释放到它们各自的分配区中,其中包含的大分子组分(例如,生物颗粒的大分子成分,例如rna、dna或蛋白质)可以在分配区内进一步处理。根据本文所述的方法和系统,单独的生物颗粒的大分子组分内容物可以具有独特标识符,使得在表征那些大分子组分时,它们可以归属为来源于相同的一个或多个生物颗粒。通过将独特标识符特定地分配给单独的生物颗粒或生物颗粒群组来提供将特征归属于单独的生物颗粒或生物颗粒群组的能力。独特标识符(例如,以核酸条形码的形式)可以被指定或与各个生物颗粒或生物颗粒群组缔合,以便用独特标识符对生物颗粒的大分子组分(并且导致其特征)加标签或进行标记。然后可以使用这些独特标识符以将生物颗粒的组分和特征归属于单独的生物颗粒或生物颗粒群组。在一些方面中,这通过将单独的生物颗粒或生物颗粒群组与独特标识符共分配来执行,例如如上所述(参见图2)。在一些方面中,独特标识符以核酸分子(例如,寡核苷酸)的形式提供,所述核酸分子包含核酸条形码序列,所述核酸条形码序列可以附接于单独的生物颗粒的核酸内容物或以其他方式与单独的生物颗粒的核酸内容物缔合,或附接于生物颗粒的其他组分,特别是那些核酸的片段。核酸分子被分配,使得在给定分配区中的核酸分子之间,其中包含的核酸条形码序列是相同的,但是在不同分配区之间,核酸分子可以并且确实具有不同的条形码序列,或者至少表示在给定分析中所有分配区中的大量不同条形码序列。在一些方面中,只有一个核酸条形码序列可以与给定的分配区缔合,但是在一些情况下,可以存在两个或更多个不同的条形码序列。核酸条形码序列可以在核酸分子(例如,寡核苷酸)的序列内包括约6至约20个或更多个核苷酸。核酸条形码序列可包括约6至约20、30、40、50、60、70、80、90、100或更多个核苷酸。在一些情况下,条形码序列的长度可以是约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,条形码序列的长度可以是至少约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,条形码序列的长度可以是至多约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更短。这些核苷酸可以是完全连续的,即在相邻核苷酸的单个区段中,或者他们可以被分成两个或多个由1个或多个核苷酸隔开的单独子序列。在一些情况下,分离的条形码子序列的长度可为约4至约16个核苷酸。在一些情况下,条形码子序列可以是约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下,条形码子序列可以是至少约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下,条形码子序列可以是至多约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更短。共分配的核酸分子还可以包含可用于处理来自共分配的生物颗粒的核酸的其他功能序列。这些序列包括例如靶向或随机/通用扩增引物序列,其用于从分配区内的各个生物颗粒扩增基因组dna,同时附接缔合的条形码序列、测序引物或引物识别位点,杂交或探测序列,例如用于鉴定序列存在或用于下拉条形码化核酸,或许多其他潜在的功能序列中任一种。也可以使用共分配寡核苷酸的其他机制,包括例如两个或更多个液滴的聚结,其中一个液滴含有寡核苷酸,或将寡核苷酸微分配到分配区中,例如微流体系统内的液滴。在一个实例中,提供微胶囊(例如珠粒),其各自包括大量可释放地附接于珠粒的上述条形码化核酸分子(例如,条形码化寡核苷酸),其中附接于特定珠粒的所有核酸分子将包括相同的核酸条形码序列,但是在所使用的珠粒群体中表示大量不同的条形码序列。在一些实施方案中,水凝胶珠粒(例如包含聚丙烯酰胺聚合物基质)用作核酸分子进入分配区的固体支持物和递送载体,因为它们能够携带大量核酸分子,并且可以配置为在暴露于特定刺激时释放那些核酸分子,如本文其他地方所述。在一些情况下,珠粒群体提供各种条形码序列文库,其包括至少约1,000种不同的条形码序列、至少约5,000种不同的条形码序列、至少约10,000种不同的条形码序列、至少约50,000种不同的条形码序列、至少约100,000种不同的条形码序列、至少约1,000,000种不同的条形码序列、至少约5,000,000种不同的条形码序列或至少约10,000,000种不同的条形码序列或更多。另外,每个珠粒可以具有大量附接的核酸(例如寡核苷酸)分子。特别地,在单独的珠粒上包括条形码序列的核酸分子的分子数可以是至少约1,000个核酸分子、至少约5,000个核酸分子、至少约10,000个核酸分子、至少约50,000个核酸分子、至少约100,000个核酸分子、至少约500,000个核酸、至少约1,000,000个核酸分子、至少约5,000,000个核酸分子、至少约10,000,000个核酸分子、至少约50,000,000个核酸分子、至少约100,000,000个核酸分子、至少约250,000,000个核酸分子并且在一些情况下至少约10亿个核酸分子,或更多。给定珠粒的核酸分子可包括相同(或共同)条形码序列、不同条形码序列或两者的组合。给定珠粒的核酸分子可包括多组核酸分子。给定组的核酸分子可包括相同的条形码序列。相同的条形码序列可以与另一组的核酸分子的条形码序列不同。此外,当分配珠粒群体时,所得到的分配区群体还可以包括各种条形码文库,其包括至少约1,000种不同的条形码序列、至少约5,000种不同的条形码序列、至少约10,000种不同的条形码序列、至少约50,000种不同的条形码序列、至少约100,000种不同的条形码序列、至少约1,000,000种不同的条形码序列、至少约5,000,000种不同的条形码序列、或至少约10,000,000种不同的条形码序列。另外,群体的每个分配区可以包括至少约1,000个核酸分子、至少约5,000个核酸分子、至少约10,000个核酸分子、至少约50,000个核酸分子、至少约100,000个核酸分子、至少约500,000个核酸、至少约1,000,000个核酸分子、至少约5,000,000个核酸分子、至少约10,000,000个核酸分子、至少约50,000,000个核酸分子、至少约100,000,000个核酸分子、至少约250,000,000个核酸分子并且在一些情况下至少约10亿个核酸分子。在一些情况下,可能希望将多个不同的条形码掺入给定分配区内,或者附接到分配区内的单个或多个珠粒上。例如,在一些情况下,混合但已知组的条形码序列可以在后续处理中提供更大的识别保证,例如,通过向给定分配区提供更强的地址或条形码属性,作为从给定分配区输出的重复或独立确认。核酸分子(例如,寡核苷酸)在对珠粒施加特定刺激时可从珠粒中释放。在一些情况下,刺激可以是光刺激,例如通过裂解光不稳定键以释放核酸分子。在其他情况下,可以使用热刺激,其中珠粒环境的温度升高将导致键裂解或核酸分子从珠粒中的其他释放。在其他情况下,可以使用化学刺激,其裂解核酸分子与珠粒的键,或者以其他方式导致核酸分子从珠粒中释放。在一种情况下,这样的组合物包括上述用于包封生物颗粒的聚丙烯酰胺基质,并且可以通过暴露于还原剂如dtt而降解以释放附接的核酸分子。在一些方面中,提供了用于受控分配的系统和方法。可以通过调节通道架构(例如,微流体通道架构)中的某些几何特征来控制液滴尺寸。例如,可以调节通道的扩张角、宽度和/或长度来控制液滴尺寸。图4显示了用于将珠粒受控地分配到离散液滴中的微流体通道结构的实例。通道结构400可包括在通道汇合点406(或交叉点)处与贮存器404连通的通道区段402。贮存器404可以是腔室。如本文所用,对“贮存器”的任何提及也可以指“腔室”。在操作中,包括悬浮珠粒412的含水流体408可以沿着通道区段402输送到汇合点406处以相遇与贮存器404中含水流体408不混溶的第二流体410,以产生流入贮存器404的含水流体408的液滴416、418。在含水流体408和第二流体410相遇的汇合点406处,可以基于各种因素形成液滴,例如在汇合点406处的流体动力,两种流体408、410的流速,流体性质以及通道结构400的某些几何参数(例如,w、h0、α等)。多个液滴通过连续地从通道区段402注入含水流体408通过汇合点406而收集在贮存器404中。产生的离散液滴可包括珠粒(例如,如在占据的液滴416中)。或者,产生的离散液滴可包括多于一个珠粒。或者,产生的离散液滴可以不包括任何珠粒(例如,如在未占据的液滴418中)。在一些情况下,产生的离散液滴可含有一个或多个生物颗粒,如本文其他地方所述。在一些情况下,产生的离散液滴可包含一种或多种试剂,如本文其他地方所述。在一些情况下,含水流体408可以具有基本均匀浓度或频率的珠粒412。珠粒412可以从单独的通道(图4中未示出)引入到通道区段402中。通道区段402中珠粒412的频率可以通过控制珠粒412被引入通道区段402的频率和/或通道区段402和单独通道中流体的相对流速来控制。在一些情况下,珠粒可以从多个不同的通道引入到通道区段402中,并且相应地控制频率。在一些情况下,通道区段402中的含水流体408可包括生物颗粒(例如,参见图1和图2描述)。在一些情况下,含水流体408可具有基本均匀浓度或频率的生物颗粒。与珠粒一样,生物颗粒可以从单独通道引入到通道区段402中。可以通过控制生物颗粒被引入到通道区段402的频率和/或通道区段402和单独通道中流体的相对流速来控制通道区段402中的含水流体408中的生物颗粒的频率或浓度。在一些情况下,可以从多个不同的通道将生物颗粒引入到通道区段402中,并相应地控制频率。在一些情况下,第一单独通道可以引入珠粒,并且第二单独通道可以将生物颗粒引入到通道区段402中。引入珠粒的第一单独通道可以在引入生物颗粒的第二单独通道的上游或下游。第二流体410可包含油,例如氟化油,其包括用于稳定所得液滴(例如,抑制所得液滴的后续聚结)的含氟表面活性剂。在一些情况下,第二流体410可以不经受和/或被引导任何流入或流出贮存器404。例如,第二流体410可以在贮存器404中是基本静止的。在一些情况下,第二流体410可以在贮存器404内流动,但不流入或流出贮存器404,例如通过向贮存器404施加压力和/或在汇合点406处受到含水流体408的进入流的影响。或者,第二流体410可以经受和/或被引导流入或流出贮存器404。例如,贮存器404可以是将第二流体410从上游引导到下游的通道,从而输送所产生的液滴。在汇合点406处或附近的通道结构400可具有某些几何特征,其至少部分地确定通过通道结构400形成的液滴的尺寸。通道区段402可在汇合点406处或附近具有高度h0和宽度w。举例来说,通道区段402可包括矩形横截面,其通向具有较宽横截面(例如在宽度或直径方面)的贮存器404。或者,通道区段402的横截面可以是其他形状,例如圆形、梯形、多边形或任何其他形状。在汇合点406处或附近的贮存器404的顶壁和底壁可以以扩张角α倾斜。扩散角α允许舌部(在汇合点406处离开通道区段402并在液滴形成之前进入贮存器404的部分含水流体408)增加深度并有助于减小中间形成的液滴的曲率。液滴尺寸可随着扩张角的增加而减小。可以通过针对上述几何参数h0、w和α的以下等式预测所得的液滴半径rd:举例来说,对于w=21μm,h=21μm和α=3°的通道结构,预测的液滴尺寸为121μm。在另一个实例中,对于w=25μm,h=25μm和α=5°的通道结构,预测的液滴尺寸是123μm。在另一个实例中,对于w=28μm,h=28μm和α=7°的通道结构,预测的液滴尺寸是124μm。在一些情况下,扩张角α的范围可以在约0.5°至约4°、约0.1°至约10°、或约0°至约90°的范围之间。例如,扩张角可以是至少约0.01°、0.1°、0.2°、0.3°、0.4°、0.5°、0.6°、0.7°、0.8°、0.9°、1°、2°、3°、4°、5°、6°、7°、8°、9°、10°、15°、20°、25°、30°、35°、40°、45°、50°、55°、60°、65°、70°、75°、80°、85°或更高。在一些情况下,扩张角可以是至多约89°、88°、87°、86°、85°、84°、83°、82°、81°、80°、75°、70°、65°、60°、55°、50°、45°、40°、35°、30°、25°、20°、15°、10°、9°、8°、7°、6°、5°、4°、3°、2°、1°、0.1°、0.01°或更小。在一些情况下,宽度w可以在约100微米(μm)至约500μm的范围之间。在一些情况下,宽度w可以在约10μm至约200μm的范围之间。或者,宽度可小于约10μm。或者,宽度可以大于约500μm。在一些情况下,进入汇合点406的含水流体408的流速可在约0.04微升(μl)/分钟(min)与约40μl/min之间。在一些情况下,进入汇合点406的含水流体408的流速可在约0.01微升(μl)/分钟(min)与约100μl/min之间。或者,进入汇合点406的含水流体408的流速可小于约0.01μl/min。或者,进入汇合点406的含水流体408的流速可以大于约40μl/min,例如45μl/min、50μl/min、55μl/min、60μl/min、65μl/min、70μl/min、75μl/min、80μl/min、85μl/min、90μl/min、95μl/min、100μl/min、110μl/min、120μl/min、130μl/min、140μl/min、150μl/min或更高。在较低的流速下,例如约小于或等于10微升/分钟的流速,液滴半径可能不取决于进入汇合点406的含水流体408的流速。在一些情况下,至少约50%的产生的液滴可具有一致的尺寸。在一些情况下,至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的产生的液滴可以具有一致的尺寸。或者,小于约50%的产生的液滴可具有一致的尺寸。可以通过增加生成点来增加液滴生成的通量,例如增加含水流体408通道区段(例如,通道区段402)与贮存器404之间的汇合点(例如,汇合点406)的数量。作为替代或补充,可以通过增加通道区段402中的含水流体408的流速来增加液滴产生的通量。图5显示了用于增加液滴产生通量的微流体通道结构的实例。微流体通道结构500可包括多个通道区段502和贮存器504。多个通道区段502中的每一个可与贮存器504流体连通。通道结构500可在多个通道区段502与贮存器504之间包括多个通道汇合点506。每个通道汇合点可以是液滴产生点。来自图4中的通道结构400的通道区段402以及对其部件的任何描述可以对应于通道结构500中的多个通道区段502的给定通道区段以及对其相应部件的任何描述。来自通道结构400的贮存器404以及对其部件的任何描述可以对应于来自通道结构500的贮存器504以及对其相应部件的任何描述。多个通道区段502中的每个通道区段可包括含水流体508,所述含水流体包括悬浮珠粒512。贮存器504可包括与含水流体508不混溶的第二流体510。在一些情况下,第二流体510可以不经受和/或被引导任何流入或流出贮存器504。例如,第二流体510可以在贮存器504中是基本静止的。在一些情况下,第二流体510可以在贮存器504内流动,但不流入或流出贮存器504,例如通过向贮存器504施加压力和/或在汇合点处受到含水流体508的进入流的影响。或者,第二流体510可以经受和/或被引导流入或流出贮存器504。例如,贮存器504可以是将第二流体510从上游引导到下游的通道,从而输送所产生的液滴。在操作中,包括悬浮珠粒512的含水流体508可以沿着多个通道区段502输送到多个汇合点506中以与贮存器504中的第二流体510相遇以产生液滴516、518。从每个通道区段,在与贮存器504的每个相应汇合点处,可形成液滴。在含水流体508和第二流体510相遇的汇合点处,可以基于各种因素形成液滴,例如在汇合点处的流体动力,两种流体508、510的流速,流体性质以及通道结构500的某些几何参数(例如,w、h0、α等),如本文其他地方所述。多个液滴可以通过连续地从多个通道区段502注入含水流体508通过多个汇合点506而收集在贮存器504中。通过通道结构500的平行通道配置,通量可以显著增加。例如,具有五个包括含水流体508的入口通道区段的通道结构可以产生频率是具有一个入口通道区段的通道结构五倍的液滴,条件是通道区段中的流体流速基本上相同。不同入口通道区段中的流体流速可以基本上相同或不同。通道结构可以具有依据实际并且允许贮存器的尺寸那么多的平行通道区段。例如,通道结构可以具有至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、500、250、300、350、400、450、500、600、700、800、900、1000、1500、5000或更多个平行或基本平行的通道区段。对于多个通道区段502中的每个通道区段,几何参数w、h0和α可以是一致或不一致的。例如,每个通道区段可以在其与贮存器504的各自通道汇合点处或附近具有相同或不同的宽度。例如,每个通道区段可以在其与贮存器504的各自通道汇合点处或附近具有相同或不同的高度。在另一个实例中,贮存器504可以在与多个通道区段502的不同通道汇合点处具有相同或不同的扩张角。当几何参数一致时,有利地,即使增加了通量,也可以控制液滴尺寸为一致的。在一些情况下,当希望具有不同的液滴尺寸分布时,可以相应地改变多个通道区段502的几何参数。在一些情况下,至少约50%的产生的液滴可具有一致的尺寸。在一些情况下,至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的产生的液滴可以具有一致的尺寸。或者,小于约50%的产生的液滴可具有一致的尺寸。图6显示了用于增加液滴产生通量的微流体通道结构的另一实例。微流体通道结构600可包括围绕贮存器604的周边大致圆形布置的多个通道区段602。多个通道区段602中的每一个可与贮存器604流体连通。通道结构600可在多个通道区段602与贮存器604之间包括多个通道汇合点606。每个通道汇合点可以是液滴产生点。来自图2中的通道结构400的通道区段402以及对其部件的任何描述可以对应于通道结构600中的多个通道区段602的给定通道区段以及对其相应部件的任何描述。来自通道结构400的贮存器404以及对其部件的任何描述可以对应于来自通道结构600的贮存器604以及对其相应部件的任何描述。多个通道区段602中的每个通道区段可包括含水流体608,所述含水流体包括悬浮珠粒612。贮存器604可包括与含水流体608不混溶的第二流体610。在一些情况下,第二流体610可以不经受和/或被引导任何流入或流出贮存器604。例如,第二流体610可以在贮存器604中是基本静止的。在一些情况下,第二流体610可以在贮存器604内流动,但不流入或流出贮存器604,例如通过向贮存器604施加压力和/或在汇合点处受到含水流体608的进入流的影响。或者,第二流体610可以经受和/或被引导流入或流出贮存器604。例如,贮存器604可以是将第二流体610从上游引导到下游的通道,从而输送所产生的液滴。在操作中,包括悬浮珠粒612的含水流体608可以沿着多个通道区段602输送到多个汇合点606中以与贮存器604中的第二流体610相遇以产生多个液滴616。从每个通道区段,在与贮存器604的每个相应汇合点处,可形成液滴。在含水流体608和第二流体610相遇的汇合点处,可基于多种因素形成液滴,例如汇合点处的水动力,两种流体608、610的流速,流体性质以及通道结构600的某些几何参数(例如,通道区段602的宽度和高度、贮存器604的扩张角等),如本文其他地方所述。多个液滴可以通过连续地从多个通道区段602注入含水流体608通过多个汇合点606而收集在贮存器604中。通过通道结构600的基本平行通道配置,通量可以显著增加。通道结构可以具有依据实际并且贮存器的尺寸允许的那么多的基本平行通道区段。例如,通道结构可以具有至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、600、700、800、900、1000、1500、5000或更多个平行或基本平行的通道区段。多个通道区段可以基本上均匀地间隔开,例如,围绕贮存器的边缘或周边。或者,多个通道区段的间隔可以是不均匀的。贮存器604可以在每个通道汇合点处或附近具有扩张角α(图6中未示出)。多个通道区段602中的每个通道区段可以在通道汇合点处或附近具有宽度w和高度h0。对于多个通道区段602中的每个通道区段,几何参数w、h0和α可以是一致或不一致的。例如,每个通道区段可以在其与贮存器604的各自通道汇合点处或附近具有相同或不同的宽度。例如,每个通道区段可以在其与贮存器604的各自通道汇合点处或附近具有相同或不同的高度。贮存器604可以在与多个通道区段602的不同通道汇合点处具有相同或不同的扩张角。例如,圆形贮存器(如图6所示)可以具有圆锥形、圆顶状、或者半球形顶板(例如,顶壁)以在多个通道汇合点606处或附近为每个通道区段602提供相同或基本相同的扩张角。当几何参数一致时,有利地,即使增加了通量,也可以控制所得液滴尺寸为一致的。在一些情况下,当希望具有不同的液滴尺寸分布时,可以相应地改变多个通道区段602的几何参数。在一些情况下,至少约50%的产生的液滴可具有一致的尺寸。在一些情况下,至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的产生的液滴可以具有一致的尺寸。或者,小于约50%的产生的液滴可具有一致的尺寸。注入液滴中的珠粒和/或生物颗粒可以具有一致或不一致的尺寸。图7a显示了具有用于受控分配的几何特征的微流体通道结构的另一实例的横截面图。通道结构700可包括在通道汇合点706(或交叉点)处与贮存器704连通的通道区段702。在一些情况下,通道结构700和其一个或多个部件可对应于通道结构100和其一个或多个部件。图7b显示了图7a的通道结构700的透视图。包括多个颗粒716的含水流体712可以沿着通道区段702输送到汇合点706处以相遇与贮存器704中含水流体712不混溶的第二流体714(例如,油等),以产生流入贮存器704的含水流体712的液滴720。在含水流体712和第二流体714相遇的汇合点706处,可以基于各种因素形成液滴,例如在汇合点706处的流体动力,两种流体712、714的相对流速,流体性质以及通道结构700的某些几何参数(例如,δh等)。多个液滴可以通过连续地从通道区段702注入含水流体712在汇合点706处收集在贮存器704中。产生的离散液滴可以包括多个颗粒716中的一个或多个颗粒。如本文其他地方所述,颗粒可以是任何颗粒,例如珠粒、细胞珠、凝胶珠粒、生物颗粒、生物颗粒的大分子组分、或其他颗粒。或者,产生的离散液滴可以不包括任何颗粒。在一些情况下,含水流体712可以具有基本均匀浓度或频率的颗粒716。如本文其他地方所述(例如,参见图4),可将颗粒716(例如,珠粒)从单独通道(图7中未示出)引入通道区段702中。通道区段702中颗粒716的频率可以通过控制颗粒716被引入通道区段702的频率和/或通道区段702和单独通道中流体的相对流速来控制。在一些情况下,颗粒716可以从多个不同的通道引入到通道区段702中,并且相应地控制频率。在一些情况下,可以通过单独通道引入不同的颗粒。例如,第一单独通道可以引入珠粒,并且第二单独通道可以将生物颗粒引入到通道区段702中。引入珠粒的第一单独通道可以在引入生物颗粒的第二单独通道的上游或下游。在一些情况下,第二流体714可以不经受和/或被引导任何流入或流出贮存器704。例如,第二流体714可以在贮存器704中是基本静止的。在一些情况下,第二流体714可以在贮存器704内流动,但不流入或流出贮存器704,例如通过向贮存器704施加压力和/或在汇合点706处受到含水流体712的进入流的影响。或者,第二流体714可以经受和/或被引导流入或流出贮存器704。例如,贮存器704可以是将第二流体714从上游引导到下游的通道,从而输送所产生的液滴。在汇合点706处或附近的通道结构700可具有某些几何特征,其至少部分地确定通过通道结构700形成的液滴的尺寸和/或形状。通道区段702可具有第一横截面高度h1,并且贮存器704可具有第二横截面高度h2。第一横截面高度h1和第二横截面高度h2可以不同,使得在汇合点706处存在高度差δh。第二横截面高度h2可以大于第一横截面高度h1。在一些情况下,贮存器此后可以逐渐增加横截面高度,例如,距离汇合点706越远。在一些情况下,贮存器的横截面高度可以根据在汇合点706处或附近的扩张角β而增加。高度差δh和/或扩张角β可以允许舌部(在汇合点706处离开通道区段702并在液滴形成之前进入贮存器704的部分含水流体712)增加深度并有助于减小中间形成的液滴的曲率。例如,液滴尺寸可随着高度差增大和/或扩张角增大而减小。高度差δh可以为至少约1μm。或者,高度差可以是至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500μm或更多。或者,高度差可以是至多约500、400、300、200、100、90、80、70、60、50、45、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1μm或更小。在一些情况下,扩张角β的范围可以在约0.5°至约4°、约0.1°至约10°、或约0°至约90°的范围之间。例如,扩张角可以是至少约0.01°、0.1°、0.2°、0.3°、0.4°、0.5°、0.6°、0.7°、0.8°、0.9°、1°、2°、3°、4°、5°、6°、7°、8°、9°、10°、15°、20°、25°、30°、35°、40°、45°、50°、55°、60°、65°、70°、75°、80°、85°或更高。在一些情况下,扩张角可以是至多约89°、88°、87°、86°、85°、84°、83°、82°、81°、80°、75°、70°、65°、60°、55°、50°、45°、40°、35°、30°、25°、20°、15°、10°、9°、8°、7°、6°、5°、4°、3°、2°、1°、0.1°、0.01°或更小。在一些情况下,进入汇合点706的含水流体712的流速可在约0.04微升(μl)/分钟(min)与约40μl/min之间。在一些情况下,进入汇合点706的含水流体712的流速可在约0.01微升(μl)/分钟(min)与约100μl/min之间。或者,进入汇合点706的含水流体712的流速可小于约0.01μl/min。或者,进入汇合点706的含水流体712的流速可以大于约40μl/min,例如45μl/min、50μl/min、55μl/min、60μl/min、65μl/min、70μl/min、75μl/min、80μl/min、85μl/min、90μl/min、95μl/min、100μl/min、110μl/min、120μl/min、130μl/min、140μl/min、150μl/min或更高。在较低的流速下,例如约小于或等于10微升/分钟的流速,液滴半径可能不取决于进入汇合点706的含水流体712的流速。第二流体714可以在贮存器704中是静止的或者基本静止的。或者,第二流体714可以是流动的,例如以上针对含水流体712所述的流速。在一些情况下,至少约50%的产生的液滴可具有一致的尺寸。在一些情况下,至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的产生的液滴可以具有一致的尺寸。或者,小于约50%的产生的液滴可具有一致的尺寸。尽管图7a和图7b说明了在汇合点706处陡峭的高度差δh(例如,阶度增加),但高度差可以逐渐增加(例如,从约0μm到最大高度差)。或者,高度差可以从最大高度差逐渐减小(例如,渐缩)。如本文所使用的,高度差的逐渐增大或减小可以指高度差的连续增量增大或减小,其中高度轮廓的任一差别区段与高度轮廓的紧邻的差别区段之间的角度大于90°。例如,在汇合点706处,通道的底壁和贮存器的底壁可以以大于90°的角度相遇。作为替代或补充,通道的顶壁(例如,天花板)和贮存器的顶壁(例如,顶板)可以以大于90°的角度相遇。逐渐增加或减小可以是线性的或非线性的(例如,指数的、正弦的等)。作为替代或补充,高度差可以线性地或非线性地可变地增加和/或减小。虽然图7a和7b说明了呈线性(例如,恒定的扩张角,β)的扩张贮存器横截面高度,但是横截面高度可以非线性地扩张。例如,贮存器可以至少部分地由具有可变扩张角的圆顶状(例如,半球形)形状限定。横截面高度可以以任何形状扩张。例如,如上文或本文其他地方所述的通道网络可以流体地联接到适当的流体部件。例如,入口通道区段流体地联接到它们要递送到通道汇合点的材料的适当来源。这些来源可以包括多种不同的流体部件中的任一种,从在微流体装置的主体结构中限定或与其连接的简易贮存器,到从装置外来源、歧管、流体流动单元(例如,致动器、泵、压缩机)等递送流体的流体管道。同样地,出口通道区段(例如,通道区段208、贮存器604等)可以流体地联接到分配细胞的接收容器或导管以便后续处理。同样,这可以是在微流体装置的主体中限定的贮存器,或者其可以是用于将分配细胞递送到随后的处理操作、仪器或部件的流体导管。本文描述的方法和系统可用于极大地提高单细胞应用和/或接收基于液滴的输入的其他应用的效率。例如,在对占据细胞和/或适当大小的细胞进行分选之后,可以执行的后续操作可以包括产生扩增产物、纯化(例如,通过固相可逆固定化(spri))、进一步处理(例如,剪切、功能序列的连接和随后的扩增(例如,通过pcr))。这些操作可以批量发生(例如,在分配区外)。在分配区是乳液中的液滴的情况下,可以破坏乳液并将液滴的内容物合并用于另外的操作。可连同携带条形码的珠粒共分配的其他试剂可包括阻断核糖体rna(rrna)的寡核苷酸和消化细胞中基因组dna的核酸酶。或者,可以在另外的处理操作期间应用rrna去除剂。通过这种方法产生的构建体的构型可有助于在测序期间最小化(或避免)聚-t序列的测序和/或测序多核苷酸序列的5'末端。可以对扩增产物(例如,第一扩增产物和/或第二扩增产物)进行测序以进行序列分析。在一些情况下,可以使用测序用部分发夹扩增(partialhairpinamplificationforsequencing;phase)方法执行扩增。多种应用需要生物颗粒群体内不同生物颗粒或生物体类型的存在的评估和其量化,包括例如微生物菌群分析和表征、环境测试、食品安全测试、流行病学分析,例如,追踪污染等。用于减少或去除线粒体dna的方法和系统细胞包含核dna(例如,包含染色质的dna)和线粒体dna。在本文所述的标签化方法中,核dna和线粒体dna可易于标签化。根据细胞型,用于测量可接近性染色质的方法可产生多个测序读长,其中在约20%与80%之间的测序读长可归因于线粒体dna。如果感兴趣的是核dna(例如可接近性染色质),则可以丢弃这些读长。在标签化之前消除或减少线粒体dna或在测序之前去除或减少标签化线粒体dna片段的技术可以导致可归因于染色质的数据的增强。本公开还提供了一种增强样品中的核dna的方法。所述方法可包括减少或去除线粒体dna。在一些情况下,所述方法可以包括提供包含线粒体dna和核dna的样品,并且在为可接近性染色质分析样品中的细胞或细胞核之前从样品中去除线粒体dna或减少线粒体dna的相对量(例如,标签化)。在一些情况下,所述方法可包括提供包含线粒体dna和核dna的样品;为可接近性染色质对样品进行分析(例如,如本文所述),从而产生包含标签化线粒体dna片段和标签化核dna片段的处理样品;从处理样品中去除标签化线粒体dna片段或减少处理样品中标签化线粒体dna片段的相对量。在一些情况下,全细胞可以用作atac-seq分析的输入材料(例如,如本文所述)。在一些情况下,细胞核可用作atac-seq分析的输入材料。例如,细胞核可以用作输入材料,其中在标签化基因组dna之前去除线粒体dna。在所述方法中,可以温和地裂解全细胞以去除其细胞质膜,同时使核膜和基因组的核蛋白包装保持完整。在一些情况下,用于裂解全细胞的裂解缓冲液可包含tris-hcl、nacl、镁离子(例如mgcl2)和裂解剂中的一种或多种。裂解剂可以是例如np40、tween-20、digitonin、nonidentp40或dbdm。在随后的离心步骤中,可以将线粒体连同其他细胞碎片一起洗掉,以产生细胞核的悬浮液。在一些情况下,线粒体膜可以连同其细胞质对应物一起裂解。这可能导致线粒体dna在所述步骤中非特异性地结合核膜,因此被带入随后的标签化反应中。封闭剂(例如,封闭蛋白)可用于在细胞裂解期间防止线粒体dna与细胞核膜的非特异性结合。封闭剂可能不抑制下游生物化学。在一些情况下,封闭剂可选自由以下组成的群组:例如,单一纯化蛋白(例如,牛血清白蛋白或酪蛋白)、单一纯化糖蛋白、乳蛋白、鱼胶、正常血清(例如,胎牛血清、兔血清、山羊血清等)、缓冲液如thermofisherscientific的superblock和聚乙烯吡咯烷酮(pvp)。例如,封闭剂(例如,封闭蛋白)可以是牛血清白蛋白(bsa),一种廉价且容易获得的分离蛋白。可以将封闭蛋白(例如bsa)加入到细胞裂解期间使用的洗涤剂制剂中。封闭蛋白(例如bsa)可以封闭核膜上的可用结合位点,从而防止线粒体dna的非特异性结合。封闭剂(例如,封闭蛋白)可以以任何有用的浓度提供。封闭剂可以在包含缓冲剂的溶液中提供。在向包含一个或多个细胞和/或细胞核的样品(例如,溶液、分配区或多个分配区,例如多个含水液滴)提供封闭剂后,可以将样品搅拌和/或离心一次或多次,和/或进行一个或多个洗涤步骤。在随后的处理(例如,离心)期间,可以洗掉细胞碎片和线粒体dna(例如,上清液中)。所述方法可以将与atac-seq文库中的线粒体dna相关的测序读长的量减少至少约5%。例如,与线粒体dna相关的测序读长的量可减少至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%。在一个实例中,与线粒体dna相关的测序读长的量可减少至少约50%,例如约30%至约60%。在一些情况下,来源于样品(例如,包含一个或多个细胞和/或细胞核的溶液、分配区或多个分配区)的多个测序读长中与线粒体dna相关的测序读长的分数可以降低为少于约60%。例如,与线粒体dna相关的测序读长的分数可以降低为来源于样品的总测序读长的小于约60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%、5%、1%或更少。在一个实例中,与线粒体dna相关的测序读长的分数可以降低为来源于样品的总测序读长的约1-5%之间。在一些情况下,一种产生条形码化核酸片段的方法包括:(a)在细胞裂解剂和封闭剂存在下裂解多个细胞以产生多个裂解细胞;(b)从多个裂解细胞中分离多个细胞核以产生多个生物颗粒,其中单独的生物颗粒(例如细胞)包含非模板核酸和包含模板核酸的染色质;(c)提供(i)包含转座子末端序列的多个转座子末端核酸分子和(ii)多个转座酶核酸分子;(d)借助于转座酶-核酸复合物在多个生物颗粒的生物颗粒中产生多个模板核酸片段,所述转座酶-核酸复合物包含多个转座酶核酸分子中的转座酶核酸分子和多个转座子末端核酸分子中的转座子末端核酸分子;(e)产生分配区(例如,液滴或孔),所述分配区包含有包含多个模板核酸片段的生物颗粒和多个包含条形码序列的条形码寡核苷酸分子(例如,核酸条形码分子);以及(f)使用多个条形码寡核苷酸分子中的条形码寡核苷酸分子(例如,核酸条形码分子)和多个模板核酸片段中的模板核酸片段产生条形码化模板核酸片段。在一些情况下,封闭剂可包含牛血清白蛋白(bsa)。例如,封闭剂可包含3%bsa的磷酸盐缓冲盐水溶液。裂解多个细胞可以包括向多个细胞提供包含细胞裂解剂的裂解缓冲液。在一些情况下,生物颗粒可以是细胞核,其可以通过例如洗涤裂解细胞从裂解细胞中分离。在一些情况下,所述方法还包括产生测序读长。应用所述方法可以减少来源于线粒体dna的测序读长相对于产生的测序读长的总数的分数。在一些情况下,模板核酸可包含染色质。在一些情况下,一种产生条形码化核酸片段的方法包括:(a)在细胞裂解剂和封闭剂存在下裂解多个细胞以产生多个裂解细胞;(b)从多个裂解细胞中分离多个细胞核以产生多个生物颗粒,其中单独的生物颗粒包含非模板dna分子(例如,线粒体dna分子)、模板dna分子和模板rna分子;(c)提供(i)包含转座子末端序列的多个转座子末端核酸分子和(ii)多个转座酶核酸分子;(d)借助于转座酶-核酸复合物在多个生物颗粒中的生物颗粒中产生多个模板dna片段,所述转座酶-核酸复合物包含多个转座酶核酸分子中的转座酶核酸分子和多个转座子末端核酸分子中的转座子末端核酸分子;(e)产生分配区(例如,液滴或孔),所述分配区包括(i)包含多个模板核酸片段和模板rna分子的生物颗粒;(ii)包含条形码序列的多个第一条形码寡核苷酸分子(例如,第一核酸条形码分子);(iii)包含条形码序列和捕获序列的多个第二条形码寡核苷酸分子(例如,第二核酸分子);(iv)多个逆转录酶分子;(f)使用多个第一条形码寡核苷酸分子中的条形码寡核苷酸分子和多个模板dna片段中的模板dna片段产生条形码化模板dna片段;以及(g)使用多个第二条形码寡核苷酸分子中的条形码寡核苷酸分子通过逆转录从模板rna分子产生条形码cdna分子。在一些情况下,封闭剂可包含牛血清白蛋白(bsa)。例如,封闭剂可包含3%bsa的磷酸盐缓冲盐水溶液。裂解多个细胞可以包括向多个细胞提供包含细胞裂解剂的裂解缓冲液。在一些情况下,生物颗粒可以是细胞核,其可以通过例如洗涤裂解细胞从裂解细胞中分离。在一些情况下,所述方法还包括产生测序读长。应用所述方法可以减少来源于线粒体dna的测序读长相对于产生的测序读长的总数的分数。在一些情况下,模板dna分子可包含染色质。在一些情况下,从样品中减少或去除线粒体dna的方法可包括提供包含多个包含核dna和线粒体dna的细胞的样品;为可接近性染色质对多个细胞进行分析(例如,标签化,如本文所述),从而产生标签化线粒体dna片段和标签化核dna片段;并且使用酶来消除标签化线粒体dna片段,从而减少标签化线粒体dna片段在片段总数内的相对量。在一些情况下,酶可以是内切核酸酶。例如,酶可以是rna导向的dna内切核酸酶。所述酶可以是成簇规律间隔短回文序列(crispr)相关蛋白(例如核酸酶),例如cas9。酶(例如,cas9,例如重组cas9)可以与一种或多种导向rna(grna)复合。cas9-grna方案可用于靶向物质以进行切割。例如,标签化线粒体dna片段可以被切割,使得线粒体来源的dna片段不会在随后的测序中被处理。在所述方案中,可以特异性地设计grna以靶向感兴趣的物质(例如,标签化线粒体dna片段)。酶(例如,cas9,例如重组cas9)可以与grna复合以靶向人线粒体染色体的基因座。酶-grna系统的应用可导致线粒体dna片段相对于片段总数的分数的减少。在一个实例中,可以将多个grna提供给包含线粒体dna片段的混合物,其中多个grna靶向线粒体dna的不同区域。例如,多个grna可以约每250个碱基对靶向线粒体dna(例如,人线粒体染色体)。在一些情况下,与atac-seq文库中的线粒体dna相关的测序读长的量可减少至少约5%。例如,与线粒体dna相关的测序读长的量可减少至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高。在一个实例中,与线粒体dna相关的测序读长的量可减少至少约50%,例如约30%至约60%。在一些情况下,来源于样品(例如,包含一个或多个细胞和/或细胞核的溶液、分配区或多个分配区)的多个测序读长中与线粒体dna相关的测序读长的分数可以降低为少于约60%。例如,与线粒体dna相关的测序读长的分数可以降低为来源于样品的总测序读长的小于约60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%、5%、1%或更少。在一个实例中,与线粒体dna相关的测序读长的分数可以降低为来源于样品的总测序读长的约1-5%之间。在一些情况下,atac-seq和rna-seq方法可以与减少非模板(例如,线粒体)片段的方法组合。例如,方法可以包括产生条形码化模板核酸片段和条形码化cdna片段(例如,通过模板rna分子的逆转录产生)以及使用封闭剂来减少非模板片段(例如,如本文所述)。作为替代或补充,方法可包括产生条形码化模板核酸片段和条形码化cdna片段(例如,通过模板rna分子的逆转录产生)以及使用crispr相关蛋白来减少非模板片段(例如,如本文所述)。在一些情况下,非模板片段可包含线粒体dna。在一些情况下,非模板片段可包含线粒体rna。在一个实例中,提供了生物颗粒,所述生物颗粒包含模板dna分子,包含核糖体rna(rrna,例如线粒体rrna)的非模板核酸分子和模板rna分子,并且使用条形码寡核苷酸(例如,核酸条形码分子)通过逆转录由模板rna分子产生条形码化cdna(例如,如本文所述)。靶向特定非模板rrna(例如,线粒体rrna的特定区域)的导向rna分子(例如,sgrna)或由rrna分子产生的cdna分子可以与crispr相关蛋白例如cas9组合使用以选择性地消除与rrna相关的序列,例如,在对来源于生物颗粒的多个序列进行测序时。因此,本文描述的方法可以允许与非模板物质(例如非模板rrna)相关的片段和/或序列(例如,序列读长)的选择性消除以及与模板dna和rna物质相关的片段和/或序列(例如,序列读长)的相应增强。在一些情况下,用于核酸处理的方法包括:(a)产生分配区(例如,液滴或孔),其中分配区包括:(i)生物颗粒(例如,细胞);(ii)包含共同条形码序列的多个条形码寡核苷酸分子(例如,核酸条形码分子);(iii)包含转座子末端序列的多个转座子末端寡核苷酸分子(例如,转座子末端核酸分子);和(iv)多个转座酶分子,其中所述生物颗粒(例如细胞)包含模板核酸和非模板核酸;(b)借助于转座酶-核酸复合物产生多个模板核酸片段和多个非模板核酸片段(例如,线粒体核酸片段),所述转座酶-核酸复合物包含多个转座酶分子中的转座酶分子和多个转座子末端寡核苷酸分子中的转座子末端寡核苷酸分子;(c)使用多个条形码寡核苷酸分子中的条形码寡核苷酸分子和多个模板核酸片段中的模板核酸片段产生条形码化模板核酸片段;以及(d)使用(i)一种或多种靶向一种或多种非模板核酸片段的导向核糖核酸分子(grna),和(ii)成簇规律间隔短回文序列(crispr)相关(cas)核酸酶,切割多个非模板核酸片段或其衍生物的一个或多个非模板核酸片段。在一些情况下,使用多个条形码寡核苷酸分子中的条形码寡核苷酸分子和多个非模板核酸片段中的一个或多个非模板核酸片段(例如,线粒体核酸片段)产生一个或多个条形码化非模板核酸片段。在一些情况下,所述方法可以减少包含和/或来源于非模板核酸的片段和/或条形码化片段的量。例如,所述方法可以减少例如包含模板核酸片段、条形码化模板核酸片段、非模板核酸片段和条形码化非模板核酸片段中的一种或多种的混合物中非模板核酸片段和条形码化非模板核酸片段的总数。在一些情况下,内切核酸酶可以是cas9,例如重组cas9。在一些情况下,非模板核酸片段可包含线粒体dna片段。在一些情况下,模板核酸片段可包含核dna片段。在一些情况下,一种产生条形码化核酸片段的方法包括:(a)提供多个生物颗粒(例如,细胞或细胞核),单独生物颗粒(例如,细胞或细胞核)包含模板核酸(例如,染色质)和非模板核酸(例如,线粒体核酸);(b)借助于转座酶-核酸复合物,在多个生物颗粒中的生物颗粒中产生多个模板核酸片段和多个非模板核酸片段(例如,线粒体核酸片段),所述转座酶-核酸复合物包含转座酶核酸分子和转座子末端核酸分子;(c)产生包含生物颗粒以及多个包含条形码序列的条形码寡核苷酸分子(例如,核酸条形码分子)的分配区(例如,液滴或孔),所述生物颗粒包含多个模板核酸片段和多个非模板核酸片段;(d)使用多个条形码寡核苷酸分子中的条形码寡核苷酸分子和多个模板核酸片段中的模板核酸片段产生条形码化模板核酸片段;以及(e)使用(i)一种或多种靶向一种或多种非模板dna片段的导向核糖核酸分子(grna),和(ii)成簇规律间隔短回文序列(crispr)相关(cas)核酸酶,切割多个非模板dna片段或其衍生物的一个或多个非模板dna片段。在一些情况下,使用多个条形码寡核苷酸分子中的条形码寡核苷酸分子和多个非模板核酸片段中的一个或多个非模板核酸片段(例如,线粒体核酸片段)产生一个或多个条形码化非模板核酸片段。在一些情况下,所述方法可以减少包含和/或来源于非模板核酸的片段和/或条形码化片段的量。例如,所述方法可以减少例如包含模板核酸片段、条形码化模板核酸片段、非模板核酸片段和条形码化非模板核酸片段中的一种或多种的混合物中非模板核酸片段和条形码化非模板核酸片段的总数。在一些情况下,内切核酸酶可以是cas9,例如重组cas9。在一些情况下,非模板核酸片段可包含线粒体dna片段。在一些情况下,模板核酸片段可包含染色质。在一些情况下,一种产生条形码化核酸片段的方法包括:(a)产生分配区(例如,液滴或孔),其中分配区包含:(i)生物颗粒(例如,细胞或细胞核),其中生物颗粒包括模板dna分子(例如染色质)、非模板dna分子(例如,线粒体dna分子)和模板rna分子;(ii)包含条形码序列的多个第一条形码寡核苷酸分子(例如,第一核酸条形码分子);(iii)包含转座子末端序列的多个转座子末端核酸分子;(iv)多个转座酶核酸分子;(v)包含条形码序列和捕获序列的多个第二条形码寡核苷酸分子(例如,第二核酸条形码分子);以及(vi)多个逆转录酶分子;(b)借助于转座酶-核酸复合物产生多个模板dna片段和多个非模板dna片段(例如,线粒体核酸片段),所述转座酶-核酸复合物包含多个转座酶核酸分子中的转座酶核酸分子和多个转座子末端核酸分子中的转座子末端核酸分子;(c)使用多个第一条形码寡核苷酸分子中的条形码寡核苷酸分子和多个模板dna片段中的模板dna片段产生条形码化模板dna片段;(d)使用多个第二条形码寡核苷酸分子中的条形码寡核苷酸分子通过逆转录从模板rna分子产生条形码化cdna分子;以及(e)使用(i)一种或多种靶向一种或多种非模板dna片段的导向核糖核酸分子(grna),和(ii)成簇规律间隔短回文序列(crispr)相关(cas)核酸酶,切割多个非模板dna片段或其衍生物的一个或多个非模板dna片段。在一些情况下,使用多个条形码寡核苷酸分子的条形码寡核苷酸分子和多个非模板dna片段的一个或多个非模板dna片段(例如,线粒体dna片段)产生一个或多个条形码化非模板dna片段。在一些情况下,所述方法可以减少包含和/或来源于非模板dna的片段和/或条形码化片段的量。例如,所述方法可以减少例如包含模板dna片段、条形码化模板dna片段、非模板dna片段和条形码化非模板dna片段中的一种或多种的混合物中非模板dna片段和条形码化非模板dna片段的总数。在一些情况下,内切核酸酶可以是cas9,例如重组cas9。在一些情况下,非模板dna片段可包含线粒体dna片段。在一些情况下,模板dna片段可包含染色质。在一些情况下,一种产生条形码化核酸片段的方法包括:(a)提供包含模板dna分子、非模板dna分子和模板rna分子的生物颗粒(例如,细胞);(b)借助于转座酶-核酸复合物在生物颗粒中产生多个模板dna片段和非模板dna片段,所述转座酶-核酸复合物包含转座酶核酸分子和转座子末端核酸分子;(c)产生分配区(例如,液滴或孔),所述分配区包含(i)包含模板dna片段、非模板dna片段和模板rna分子的生物颗粒;(ii)包含共同条形码序列的多个第一条形码寡核苷酸分子(例如,第一核酸条形码分子);(iii)包含条形码序列和捕获序列的多个第二条形码寡核苷酸分子(例如,第二核酸分子);以及(iv)多个逆转录酶分子;(d)使用多个第一条形码寡核苷酸分子中的条形码寡核苷酸分子和多个模板dna片段中的模板dna片段产生条形码化模板dna片段;(e)使用多个第二条形码寡核苷酸分子中的条形码寡核苷酸分子通过逆转录从模板rna分子产生条形码化cdna分子;以及(f)使用(i)一种或多种靶向一种或多种非模板核酸片段的导向核糖核酸分子(grna),和(ii)成簇规律间隔短回文序列(crispr)相关(cas)核酸酶,切割多个非模板dna片段或其衍生物的一个或多个非模板dna片段。在一些情况下,使用多个条形码寡核苷酸分子的条形码寡核苷酸分子和多个非模板dna片段的一个或多个非模板dna片段(例如,线粒体dna片段)产生一个或多个条形码化非模板dna片段。在一些情况下,所述方法可以减少包含和/或来源于非模板dna的片段和/或条形码化片段的量。例如,所述方法可以减少例如包含模板dna片段、条形码化模板dna片段、非模板dna片段和条形码化非模板dna片段中的一种或多种的混合物中非模板dna片段和条形码化非模板dna片段的总数。在一些情况下,内切核酸酶可以是cas9,例如重组cas9。在一些情况下,非模板dna片段可包含线粒体dna片段。在一些情况下,模板dna片段可包含核dna片段。在一些情况下,一种产生条形码化核酸片段的方法包括:(a)提供分配区(例如,液滴或孔),其中所述分配区包含(i)生物颗粒(例如,细胞或细胞核),(ii)单个固体或半固体颗粒(例如珠粒,例如凝胶珠粒),和(iii)多个转座酶核酸分子,其中单个生物颗粒包含模板核酸分子和非模板核酸分子,其中单个固体或半固体颗粒(例如珠粒)包含可释放地与其偶合的条形码化寡核苷酸(例如,核酸条形码分子);(b)使分配区经受足以从单个生物颗粒释放模板核酸分子和非模板核酸分子的条件;(c)使分配区经受足以从固体或半固体颗粒释放条形码化寡核苷酸的条件;(d)使分配区经受足以引起条形码化寡核苷酸借助于由多个转座酶核酸分子的至少一个子集产生的转座体复合物转座到模板核酸分子和非模板核酸分子中的条件;(e)将(i)模板核酸分子片段化成包含条形码化寡核苷酸的多个双链模板核酸片段和(ii)将非模板核酸分子片段化成包含条形码化寡核苷酸的多个双链非模板核酸片段;以及(f)使用(i)一种或多种靶向一种或多种非模板核酸片段的导向核糖核酸分子(grna),和(ii)成簇规律间隔短回文序列(crispr)相关(cas)核酸酶,切割多个非模板核酸片段或其衍生物的一个或多个非模板核酸片段。在一些情况下,所述方法可以减少包含和/或来源于非模板核酸的片段的量。例如,所述方法可以减少例如包含模板核酸片段、条形码化模板核酸片段、非模板核酸片段和条形码化非模板核酸片段中的一种或多种的混合物中模板核酸片段的总数。在一些情况下,内切核酸酶可以是cas9,例如重组cas9。在一些情况下,非模板核酸片段可包含线粒体dna片段。在一些情况下,模板核酸片段可包含染色质。本方法可具有减少或去除非模板核酸(例如,线粒体dna)和/或增强可接近性染色质的作用。所述方法可以与任何细胞型一起使用(例如,如本文所述)。例如,所述方法可以与人或哺乳动物细胞一起使用。所述方法还可以与任何浓度的细胞一起使用。例如,减少或去除非模板核酸(例如,线粒体dna)和/或增强可接近性染色质的方法可以与分离细胞一起使用。在另一个实例中,减少或去除非模板核酸(例如,线粒体dna)和/或增强可接近性染色质的方法可以与多个细胞一起使用,例如多个液滴内的多个细胞或本体溶液中的多个细胞。减少或去除非模板核酸(例如,线粒体dna)和/或增强可接近性染色质的方法可以应用于任何需要减少与非模板核酸(例如,线粒体dna)或rna(包括rna-seq)相关的测序读长的文库类型。相对于与样品(例如,细胞或多个细胞)相关的读长总数减少非模板(例如,线粒体)读长和/或增强与可接近性染色质相关的读长的方法可以应用于本文描述的任何方法。例如,可以向本文描述的任何样品提供封闭剂(例如,bsa)。如上所述,使用封闭剂可以减少或防止线粒体dna非特异性地吸附到细胞核,使得在细胞核分离期间可以洗掉线粒体dna。类似地,可以在本文所述的任何标签化过程之后提供内切核酸酶,以降低包含标签化dna的样品中标签化线粒体dna的相对分数。关于处理核酸样品和减少非模板(例如线粒体)读长的其他细节和方法可以参见例如:gu等(gu,w.;crawford,e.d.;o'donovan,b.d.,wilson,m.r.,chow,e.d.,retallack,h.,和derisi,j.l.“depletionofabundantsequencesbyhybridization(dash):usingcas9toremoveunwantedhigh-abundancespeciesinsequencinglibrariesandmolecularcountingapplications,”genomebiology(2016)17:41)、montefiori等(montefiori,l.;hernandez,l.;zhang,z.;gilad,y.;ober,c.;crawford,g.;nobrega,m.;和sakabe,n.j.“reducingmitochondrialreadsinatac-sequsingcrispr/cas9,”scientificreports(2017)7:2451)以及corces等(corces,m.r.;trevino,a.e.;hamilton,e.g.;greenside,p.g.;sinnott-armstrong,n.a.;vesuna,s.;satpathy,a.t.;rubin,a.j.;montine,k.s.;wu,b.;kathiria,a.;cho,s.w.;mumbach,m.r.;carter,a.c.;kasowski,m.;orloff,l.a.;risca,v.i.;kundaje,a.;khavari,p.a.;montine,t.j.;greenleaf,w.j.;和chang,h.y.“animprovedatac-seqprotocolreducesbackgroundandenablesinterrogationoffrozentissues,”naturemethods(2017)),其中每一篇都以全文引用方式并入本文。试剂盒本文还提供了用于分析单独的细胞或小细胞群的可接近性染色质(例如,对于atac-seq)和/或rna转录物的试剂盒。试剂盒可包括以下中的一种或多种:一种、两种、三种、四种、五种或更多种,多达所有分配流体,包括含水缓冲液和非含水分配流体或油;可释放地与珠粒缔合的核酸条形码文库,如本文所述;微流体设备;用于破坏细胞扩增核酸并在细胞核酸的片段或其重复上提供额外的功能序列的试剂;以及在本文所述的方法中使用任何前述的说明书。计算机系统本公开提供了被编程用于实现本公开的方法的计算机系统。图9显示了计算机系统901,其被编程或以其他方式配置用于例如(i)控制微流体系统(例如,流体流动),(ii)从未占据的液滴中分选占据的液滴,(iii)聚合液滴,(iv)执行测序应用,(v)产生和维持dna或cdna片段文库,和/或(vi)分析可接近性染色质的区域。计算机系统901可以调节本公开的各种方面,例如像调节微流体结构中的一个或多个通道中的流体流速,调节聚合应用单元,调节本文所述的某些反应的条件。计算机系统901可以是用户的电子设备或相对于电子设备远程定位的计算机系统。电子设备可以是移动电子设备。计算机系统901包括中央处理单元(cpu,在本文中也称为“处理器”和“计算机处理器”)905,其可为单一核心或多核心处理器,或用于并行处理的多个处理器。计算机系统901还包括存储器或存储单元910(例如,随机存取存储器、只读存储器、闪速存储器),电子存储单元915(例如,硬盘),与一个或多个其他系统通信的通信接口920(例如,网络适配器),和外围装置925,诸如高速缓冲存储器、其他存储器、数据存储和/或电子显示适配器。存储器910、存储单元915、接口920和外围装置925经由通信总线(实线)诸如母板与cpu905通信。存储单元915可为用于存储数据的数据存储单元(或数据储存库)。计算机系统901可借助于通信接口920来可操作地耦接至计算机网络(“网络”)930。网络930可为互联网、互联网和/或外联网或与互联网通信的内部网和/或外联网。网络930在一些情况下为电信和/或数据网络。网络930可包括一个或多个计算机服务器,其可实现分布式计算,诸如云计算。网络930在一些情况下借助于计算机系统901,可实施对等网络,其可使得耦接至计算机系统901的装置能够作为客户端或服务器来运作。cpu905可执行序列机器可读指令,所述指令可在程序或软件中具体实现。指令可存储于存储单元,诸如存储器910中。指令可被引导至cpu905,其可随后编程或另外配置cpu905来实施本公开的方法。由cpu905执行的操作的实例可包括撷取、解码、执行和写回。cpu905可为电路的一部分,诸如集成电路。系统901的一个或多个其他部件可包含于电路中。在一些情况下,电路是专用集成电路(asic)。存储单元915可存储文件,诸如驱动程序、文库和保存程序。存储单元915可存储使用者数据,例如,使用者偏好和使用者程序。计算机系统901在一些情况下可包括一个或多个额外数据存储单元,所述单元在计算机系统901外部,诸如位于经由内部网或互联网与计算机系统901通信的远程服务器上。计算机系统901可经由网络930与一个或多个远程计算机系统通信。例如,计算机系统901可以与用户(例如,运营商)的远程计算机系统通信。远程计算机系统的实例包括个人计算机(例如,便携式pc)、板式pc或平板pc(例如,ipad、galaxytab)、电话、智能电话(例如,iphone、支持android的装置、)或个人数字助理。用户可以经由网络930访问计算机系统901。如本文描述的方法可经由机器(例如,计算机处理器)可执行代码来实施,所述代码存储于计算机系统901的电子存储位置上,例如像,存储器910或电子存储单元915。机器可执行或机器可读代码可以软件形式提供。在使用期间,代码可由处理器905执行。在一些情况下,代码可从存储单元915撷取并且存储在存储器910上准备由处理器905访问。在一些情况下,可排除电子存储单元915,并且机器可执行指令存储于存储器910上。代码可预先编译并且被配置来供具有适于执行代码的处理器的机器来使用,或可在执行时间期间加以编译。代码可以程序语言来提供,可选择所述程序语言以使得代码能够以预先编译或原样编译方式来执行。本文提供的系统和方法,诸如计算机系统901的各个方面可在程序编制中具体实现。技术的各个方面可被认为是通常呈机器(或处理器)可执行代码和/或相关数据形式的“产品”或“制品”,所述数据承载或具体实现于一定类型的机器可读介质中。机器可执行代码可存储于电子存储单元,诸如存储器(例如,只读存储器、随机存取存储器、闪速存储器)或硬盘上。“存储”类型介质可包括计算机、处理器等的任何或所有有形存储器,或其相关联模块,诸如各种半导体存储器、磁带驱动器、磁盘驱动器等,其可在任何时候提供非暂时性存储用于软件编程。软件的全部或一部分可有时经由互联网或各种其他电信网络来传送。这类通信,例如,可使得将软件从一个计算机或处理器加载至另一个计算机或处理器,例如,从管理服务器或主机计算机加载至应用服务器的计算机平台中。因此,可承载软件元件的另一种类型的介质包括光、电和电磁波,诸如跨越本地装置之间的物理接口、经由有线和光学陆地线网络和各种空中链路所使用的光、电和电磁波。携带这些波的物理元件,诸如有线或无线链路、光链路等也可被认为是承载软件的介质。如本文使用,除非限于非暂时性、有形“存储”介质,术语诸如计算机或机器“可读介质”是指参与提供指令至处理器供执行的任何介质。因此,机器可读介质,诸如计算机可执行代码,可采用许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储器介质包括,例如,光盘或磁盘,诸如任何计算机等中的任何存储装置,诸如在附图中示出的可用于实施数据库等的存储装置。易失性存储器介质包括动态存储器,诸如这类计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光导纤维,包括构成计算机系统中的总线的导线。载波传输介质可采用电或电磁信号,或声或光波的形式诸如在射频(rf)和红外(ir)数据通信期间产生的信号。常见形式的计算机可读介质因此包括例如:软盘、软磁盘、硬盘、磁带、任何其他磁介质、cd-rom、dvd或dvd-rom、任何其他光学介质、冲孔卡纸带、具有孔图案的任何其他物理存储器介质、ram、rom、prom和eprom、快闪eprom、任何其他存储器芯片或盒、运输数据或指令的载波、运输这类载波的电缆或链路,或计算机可读取编程代码和/或数据的任何其他介质。许多这些形式的计算机可读介质可涉及运送一个或多个指令的一个或多个序列至处理器供执行。计算机系统901可包括电子显示器935或与其通信,所述电子显示器包括用户界面(ui)940,其用于提供例如测序分析的结果,将测序读长与可接近性染色质区域相关联等。ui的实例包括但不限于图形用户界面(gui)和基于web的用户界面。本公开的方法和系统可经由一个或多个算法来实施。算法可在由中央处理单元905执行时经由软件来实施。算法可以例如执行测序反应、将测序读长与可接近性染色质区域相关联等。本公开的装置、系统、组合物和方法可用于各种应用,例如像处理单个细胞中的单个分析物(例如,rna、dna或蛋白质)或多种分析物(例如,dna和rna、dna和蛋白质、rna和蛋白质、或rna、dna和蛋白质)。例如,将生物颗粒(例如,细胞或细胞珠)分配在分配区(例如,液滴)中,并处理来自生物颗粒的多种分析物以用于后续处理。多种分析物可以来自单个细胞。这可以实现例如细胞的同时蛋白质组学、转录组学和基因组学分析。实施例尽管本文的一个或多个实施例使用乳液中包含液滴的分配区(例如,液滴乳液分配区),但任何上述分配区(例如孔)可以用于下文所述的方法、系统和组合物中。实施例1.使用包含转座子末端序列的叉状衔接子由单个细胞生成条形码化核酸片段分配多个转座酶分子、多个感兴趣的细胞(或例如通过非离子洗涤剂例如np-40(igepalca-630)或者tritonx-100从感兴趣的细胞收获的多个细胞核)以及多个条形码寡核苷酸(例如,核酸条形码分子),使得至少一些分配区(例如,液滴或孔)包含多个转座酶分子、单个细胞(或细胞核)和多个条形码寡核苷酸,所述条形码寡核苷酸包含测序引物序列、条形码序列和转座子末端序列。在一些实施方案中,将多个条形码寡核苷酸附接于固体或半固体颗粒(例如,凝胶珠粒)并分配,使得至少一些分配区(例如,液滴或孔)包含转座酶分子、单个细胞(或细胞核)和支持物(例如,单个凝胶珠粒)。例如,在一些实施方案中,如本文所述生成含水液滴乳液分配区,使得至少一些所形成的液滴将包含转座酶分子、细胞裂解试剂、单个细胞和包含多个条形码化叉状衔接子寡核苷酸的单个珠粒(例如,凝胶珠粒)。参见例如图10。然后使这些细胞在液滴内以一种将模板核酸分子从细胞核释放到它们对应液滴中,但基本上保持天然染色质组织的方式裂解。然后大体如图11a所概述处理液滴。具体而言,使液滴经受各种条件,以使得条形码化叉状衔接子寡核苷酸从珠粒(例如,凝胶珠粒)释放到含水液滴中(例如通过使用还原剂例如dtt解聚或降解珠粒)。虽然可以制备多种不同构型的叉状衔接子,但是示例性叉状衔接子示出在图12a中并且显示部分互补的双链寡核苷酸,其包含可释放地附接于珠粒(例如,凝胶珠粒)的第一寡核苷酸链和第二部分互补寡核苷酸链。继续参考图12a,第一链包含转座子末端序列(“嵌合末端”或“me”)、条形码序列(“bc”)和测序引物序列(“r1”)。部分互补的第二链包含:(i)与转座子末端序列完全互补的区域(“merc”);(ii)与条形码序列完全互补的区域(“bcrc”);和(iii)与第一链引物序列部分互补的引物序列(“r2”)。在替代性实施方案中(例如图12b),图12a的双链叉状衔接子还包含:(a)第一寡核苷酸链,其还包含可释放地附接于凝胶珠粒的p5序列;和(b)第二部分互补的寡核苷酸链,其还包含索引序列(“i7”)和p7序列。在叉状衔接子从珠粒(例如,凝胶珠粒)释放到液滴中之后,使液滴经受各种条件,以使得形成包含转座酶分子和两个叉状衔接子的转座酶-核酸复合物。参见图11a,第2步骤。然后使液滴经受各种条件,以使得转座酶-核酸复合物将转座子末端序列整合到模板核酸中,并将模板核酸片段化成侧接叉状衔接子的双链模板核酸片段。参见图11a,第3步骤。在替代性实施方案中,细胞(或细胞核)是透化/可渗透的,并且转座酶-核酸复合物进入细胞核以使模板核酸片段化。然后将细胞裂解以释放双链模板核酸片段。因为转座酶-核酸复合物可仅作用于无核小体模板,所以双链模板核酸片段代表单个细胞或细胞核中可接近性染色质的全基因组区域。然后从液滴中收集双链模板核酸片段并大量处理以填充由转座反应形成的任何缺口并生成适用于下一代高通量测序的文库(例如使片段或其衍生物经受一个或多个反应(例如核酸扩增),以添加功能序列,从而促进illumina测序;参见图11b)。然后根据任何合适的测序方案对完全构建的文库进行测序。实施例2.使用叉状衔接子和转座酶-核酸复合物由单个细胞生成条形码化核酸片段分配多个转座酶-核酸复合物、多个感兴趣的细胞(或从感兴趣的细胞收获的多个细胞核)以及多个条形码寡核苷酸,使得至少一些分配区(例如,液滴或孔)包含多个转座酶-核酸复合物、单个细胞(或细胞核)和多个条形码寡核苷酸(例如核酸条形码分子),所述条形码寡核苷酸包含测序引物序列和条形码序列。在一些实施方案中,将多个条形码寡核苷酸附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并分配,使得至少一些分配区(例如,液滴或孔)包含转座酶-核酸复合物、单个细胞(或细胞核)和单个固体或半固体颗粒(例如,凝胶珠粒)。在替代性实施方案中,多个转座酶分子和多个转座子末端序列寡核苷酸连同单个细胞(或细胞核)一起分配,并且在分配区(例如,液滴或孔)中生成条形码寡核苷酸和转座酶-核酸复合物。例如,在一些实施方案中,如本文所述生成液滴乳液分配区,使得至少一些液滴包含转座酶-核酸复合物、细胞裂解试剂、t4dna连接酶、单个细胞或细胞核以及包含多个条形码化叉状衔接子寡核苷酸的单个珠粒(例如,凝胶珠粒)。参见例如图13。单个转座酶-核酸复合物包含转座酶和一对双链寡核苷酸,所述双链寡核苷酸各自包含转座子末端序列(例如,me序列)。参见图13至图15。在一些实施方案中,含有双链转座子-末端序列的寡核苷酸还包含间隔序列。在液滴形成后,使单个细胞(如果存在的话)以一种将模板核酸分子从细胞核释放到液滴中,但基本上保持天然染色质组织的方式裂解。然后大体如图14a所概述处理液滴。具体而言,使液滴经受各种条件,以使得叉状衔接子从珠粒(例如,凝胶珠粒)释放到含水液滴中(例如通过使用还原剂例如dtt解聚或降解珠粒)。参见图14a,第1a步骤。虽然可以制备多种不同构型的叉状衔接子,但是示例性叉状衔接子示出在图15a中并且显示双链寡核苷酸,其包含可释放地附接于珠粒(例如,凝胶珠粒)的第一寡核苷酸链和第二部分互补寡核苷酸链。继续参考图15a,第一链包含条形码序列(“bc”)、引物序列(“r1”)和转座子末端序列(“嵌合末端”或“me”)。部分互补的第二链包含与条形码序列完全互补的区域(“bcrc”)、与第一链引物序列部分互补的引物序列(“r2”)和与转座子末端序列完全互补的区域(“merc”)。在一些实施方案中,第一链还在3'端的末端核苷酸中包含硫代磷酸酯键。在其他实施方案中,第一链在3'端的最后3-5个核苷酸中包含硫代磷酸酯键。在其他实施方案中,第一链包含遍及第一链的硫代磷酸酯键。第一寡核苷酸链可以还包含可释放地附接于珠粒(例如,凝胶珠粒)的p5衔接子序列。第二部分互补的寡核苷酸链可以还包含索引引物(“i7”)和不同于第一链的衔接子序列(“p7”)。类似地,图15b示出包含可释放地附接于珠粒(例如,凝胶珠粒)的第一寡核苷酸链和第二部分互补的寡核苷酸链的双链寡核苷酸。继续参考图15b,第一链包含条形码序列(“bc”)和引物序列(“r1”)。部分互补的第二链包含与条形码序列完全互补的区域(“bcrc”)和与第一链引物序列部分互补的引物序列(“r2”)。在一些实施方案中,第一链还在3'端的末端核苷酸中包含硫代磷酸酯键。在其他实施方案中,第一链在3'端的最后3-5个核苷酸中包含硫代磷酸酯键。在其他实施方案中,第一链包含遍及第一链的硫代磷酸酯键。第一寡核苷酸链可以还包含可释放地附接于珠粒(例如,凝胶珠粒)的p5衔接子序列。第二部分互补的寡核苷酸链可以还包含索引引物(“i7”)和不同于第一链的衔接子序列(“p7”)。在叉状衔接子从珠粒(例如,凝胶珠粒)释放到液滴中之后,使液滴经受各种条件,以使得转座酶-核酸复合物将转座子末端序列整合到模板核酸中,并将模板核酸片段化成侧接转座子末端序列的双链模板核酸片段。参见图14a,第1b步骤。在替代性实施方案中,细胞(或细胞核)是透化/可渗透的,并且转座酶-核酸复合物进入细胞核以使模板核酸在其中片段化。然后将细胞(如果存在的话)裂解以释放双链模板核酸片段。因为转座酶-核酸复合物可仅作用于无核小体模板,所以双链模板核酸片段代表单个细胞或细胞核中可接近性染色质的全基因组区域。然后将叉状衔接子连接到双链模板核酸片段的末端上。参见图14a,第2步骤。然后从液滴中收集双链模板核酸片段并大量处理以填充由转座反应形成的任何缺口并生成适用于下一代高通量测序的文库(例如使片段或其衍生物经受一个或多个反应(例如核酸扩增),以添加功能序列,从而促进illumina测序;参见图14b)。然后根据任何合适的测序方案对完全构建的文库进行测序。在一些实施方案中,利用针对间隔区-me序列的定制测序引物来避免对文库的条形码-间隔区-me区域进行测序。实施例3.使用包含t7启动子序列的衔接子由单个细胞生成条形码化核酸片段分配多个转座酶分子、多个感兴趣的细胞(或从感兴趣的细胞收获的多个细胞核)以及多个条形码寡核苷酸,使得至少一些分配区(例如,液滴或孔)包含多个转座酶分子、单个细胞(或细胞核)和多个条形码寡核苷酸(例如核酸条形码分子),所述条形码寡核苷酸包含t7启动子序列、测序引物序列、条形码序列和转座子末端序列。在一些实施方案中,将多个条形码寡核苷酸附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并分配,使得至少一些分配区(例如,液滴或孔)包含转座酶分子、单个细胞(或细胞核)和单个固体或半固体颗粒(例如,凝胶珠粒)。例如,在一些实施方案中,如先前所述生成液滴乳液分配区,使得至少一些液滴(例如,含水液滴)包含转座酶分子、细胞裂解试剂、单个细胞(或细胞核)和包含部分双链t7启动子寡核苷酸衔接子的单个珠粒(例如,凝胶珠粒)。参见例如图16。然后使细胞(如果存在的话)以一种将模板核酸分子从细胞核释放到液滴中,但基本上保持天然染色质组织的方式裂解。然后大体如图17所概述处理液滴。具体而言,使液滴(例如含水液滴)经受各种条件,使得部分双链衔接子从珠粒(例如,凝胶珠粒)释放到液滴中(例如通过使用还原剂例如dtt解聚或降解珠粒)。参见图17,第1步骤。虽然可以制备多种不同构型的部分双链衔接子,但是示例性部分双链衔接子示出在图18中并且显示部分双链寡核苷酸,其包含可释放地附接于珠粒(例如,凝胶珠粒)的第一寡核苷酸链和第二较短的互补寡核苷酸链。继续参考图18,第一链包含转座子末端(“嵌合末端”或“me”)序列、条形码序列(“bc”)、部分测序引物序列(“pr1”或“部分r1”)和t7启动子序列,而第二寡核苷酸链包含与转座子末端序列充分互补的序列(“merc”)。在部分双链衔接子从珠粒(例如,凝胶珠粒)释放到液滴中之后,使液滴经受各种条件,以使得形成包含转座酶分子和两个部分双链寡核苷酸衔接子的转座酶-核酸复合物。参见图17,第2步骤。然后使液滴或多个液滴经受各种条件,以使得转座酶-核酸复合物将衔接子整合到模板核酸中并产生侧接部分双链衔接子的双链模板核酸片段。参见图17,第3步骤。在替代性实施方案中,细胞(或细胞核)是透化/可渗透的,并且转座酶-核酸复合物进入细胞核以使模板核酸在其中片段化。然后将细胞(如果存在的话)裂解以释放双链模板核酸片段。因为转座酶-核酸复合物可仅作用于无核小体模板,所以双链模板核酸片段代表单个细胞或细胞核中可接近性染色质的全基因组区域。然后从液滴中收集双链模板核酸片段并且大量处理以填充由转座反应形成的任何缺口。使用体外转座反应和t7rna聚合酶由双链模板核酸片段生成rna。收集rna并将其纯化,然后进行第一链和第二链cdna合成。然后进一步处理双链cdna分子(包括通过例如第二转座酶介导的片段化来进行片段化和衔接子插入),以生成适用于下一代高通量测序(例如,使片段或其衍生物经受一个或多个反应(例如核酸扩增)以添加功能序列,从而促进illumina测序)的文库。然后根据任何合适的测序方案对完全构建的文库进行测序。实施例4.使用测序衔接子的转座然后进行随机引发和延伸由单个细胞生成条形码化核酸片段分配多个转座酶分子、多个感兴趣的细胞(或从感兴趣的细胞收获的多个细胞核)以及多个条形码寡核苷酸,使得至少一些分配区(例如,液滴或孔)包含多个转座酶分子、单个细胞(或细胞核)和多个条形码寡核苷酸(例如核酸条形码分子),所述条形码寡核苷酸包含测序引物序列、条形码序列和转座子末端序列。在一些实施方案中,将多个条形码寡核苷酸附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并分配,使得至少一些分配区(例如,液滴或孔)包含转座酶分子、单个细胞(或细胞核)和单个固体或半固体颗粒(例如,凝胶珠粒)。例如,在一些实施方案中,如先前所述生成液滴乳液分配区,使得至少一些液滴包含转座酶分子、细胞裂解试剂、单个细胞(或细胞核)和包含部分双链条形码化寡核苷酸衔接子的单个珠粒(例如,凝胶珠粒)。参见例如图19。然后使细胞(如果存在的话)以一种将模板核酸分子从细胞核释放到含水液滴中,但基本上保持天然染色质组织的方式裂解。然后大体如图20所概述处理液滴。具体而言,使液滴(例如含水液滴)经受各种条件,使得部分双链衔接子从珠粒(例如,凝胶珠粒)释放到液滴中(例如通过使用还原剂例如dtt解聚或降解珠粒)。参见图20,第1步骤。虽然可以制备多种不同构型的部分双链衔接子,但是示例性部分双链衔接子示出在图21中并且显示部分双链寡核苷酸,其包含可释放地附接于珠粒(例如,凝胶珠粒)的第一寡核苷酸链和第二较短的互补寡核苷酸链。继续参考图21,第一链包含转座子末端(“嵌合末端”或“me”)序列、条形码序列(“bc”)和部分测序引物序列(“pr1”或“部分r1”),而第二寡核苷酸链包含与转座子末端序列充分互补的序列(“merc”)。在部分双链衔接子从珠粒(例如,凝胶珠粒)释放到液滴(例如含水液滴)中之后,使液滴经受各种条件,以使得形成包含转座酶分子和两个部分双链寡核苷酸衔接子的转座酶-核酸复合物。参见图20,第2步骤。然后使液滴经受各种条件,以使得转座酶-核酸复合物将衔接子整合到模板核酸中并产生侧接部分双链衔接子的双链模板核酸片段。参见图20,第3步骤。在替代性实施方案中,细胞(或细胞核)是透化/可渗透的,并且转座酶-核酸复合物进入细胞核以使模板核酸片段化。然后将细胞(如果存在的话)裂解以释放双链模板核酸片段。因为转座酶-核酸复合物可仅作用于无核小体模板,所以双链模板核酸片段代表单个细胞或细胞核中可接近性染色质的全基因组区域。然后从液滴中收集双链模板核酸片段并且大量处理以生成适用于下一代高通量测序的文库。在一些实施方案中,例如,在随机引发延伸反应中大量处理双链模板核酸片段。参见例如图22。随机延伸引物具有随机个核苷酸(n-聚体)序列,并且可例如附接于第二pcr柄部(例如,部分r2序列,参见图22)。将随机延伸引物退火至双链模板核酸片段或其衍生物,并且延伸(例如图22)。然后可以清除反应并且使延伸产物经受一个或多个反应(例如,核酸扩增)以添加功能序列,从而促进illumina测序(例如,图22)。然后根据任何合适的测序方案对完全构建的文库进行测序。实施例5.使用转座酶-核酸复合物和条形码化衔接子由单个细胞生成条形码化核酸片段在一些实施方案中,设计人工转座子以将感兴趣的序列插入到靶标dna分子(例如开放染色质)中。例如,包含条形码序列和衔接子序列的人工转座子寡核苷酸在寡核苷酸的每个末端上侧接转座子末端序列(参见例如图23)。分配多个转座酶分子、多个感兴趣的细胞(或从感兴趣的细胞收获的多个细胞核)以及多个人工转座子寡核苷酸,使得至少一些分配区(例如,液滴或孔)包含多个人工转座子寡核苷酸、多个转座酶分子和单个细胞(或细胞核)。在一些实施方案中,将多个人工转座子寡核苷酸附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并分配,使得至少一些分配区(例如,液滴或孔)包含多个转座酶分子、单个细胞(或细胞核)和单个固体或半固体颗粒(例如,凝胶珠粒)。在其他实施方案中,分配包含含有条形码序列和侧接所测序转座子末端的衔接子序列的人工转座子寡核苷酸的多个转座子核酸复合物,使得至少一些分配区包含多个转座子核酸复合物和单个细胞(或细胞核)。在一些实施方案中,将多个人工转座子寡核苷酸附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并分配,使得至少一些分配区(例如,液滴或孔)包含单个细胞(或细胞核)和单个固体或半固体颗粒(例如,凝胶珠粒)。例如,在一些实施方案中,如先前所述生成液滴乳液分配区,使得至少一些液滴包含转座酶分子、细胞裂解试剂、单个细胞(或细胞核)和单个珠粒(例如,凝胶珠粒)。然后将细胞裂解以将模板核酸分子从细胞核释放到含水液滴中。然后大体如图23所概述处理液滴。具体而言,使液滴(例如含水液滴)经受各种条件,使得条形码化衔接子从珠粒(例如,凝胶珠粒)释放到液滴中(例如通过使用还原剂例如dtt解聚或降解珠粒)。虽然可以制备多种不同构型的条形码化衔接子,但是示例性条形码化衔接子示出在图23中并且为可释放地附接于珠粒(例如,凝胶珠粒)的双链寡核苷酸,其中所述条形码化衔接子包含侧接条形码序列(“bc”)和衔接子序列(“p5”)的一对转座子末端(“嵌合末端”或“me”)序列。在条形码化衔接子从珠粒(例如,凝胶珠粒)释放到液滴中之后,使液滴经受各种条件,以使得形成包含转座酶分子和含有一对转座子末端序列的条形码化衔接子的转座酶-核酸复合物。参见图23。然后使液滴或多个液滴经受各种条件,以使得转座酶-核酸复合物将条形码化衔接子整合到模板核酸中。参见图23。在替代性实施方案中,细胞(或细胞核)是透化/可渗透的,并且转座酶-核酸复合物进入细胞核以执行转座反应。然后将细胞(如果存在的话)裂解以释放含有转座子的模板核酸片段。然后从液滴中收集条形码转座的模板核酸并大量处理以将条形码转座的模板核酸片段化并且生成适用于下一代高通量测序的文库(例如使片段或其衍生物经受一个或多个反应(例如核酸扩增),以添加功能序列,从而促进illumina测序)。然后根据任何合适的测序方案对完全构建的文库进行测序。实施例6.使用凝胶珠粒官能化转座酶-核酸复合物由单个细胞生成条形码化核酸片段分配多个转座酶核酸复合物和多个感兴趣的细胞(或者从感兴趣的细胞收获的多个细胞核),使得至少一些分配区(例如,液滴或孔)包含单个细胞(或细胞核)和多个转座酶核酸复合物,其包含转座酶分子和条形码寡核苷酸(例如,核酸条形码分子),所述条形码寡核苷酸包含测序引物序列、条形码序列和转座子末端序列(参见例如图24a至图24b和图25a至图25b)。在一些实施方案中,将多个转座酶核酸复合物附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)(参见例如图24a至图24b和图26)并且分配,使得至少一些分配区(例如,液滴或孔)包含单个细胞(或细胞核)和单个固体或半固体颗粒(例如,凝胶珠粒)。例如,在一些实施方案中,如先前所述生成液滴乳液分配区,使得至少一些液滴(例如,含水液滴)包含细胞裂解试剂、单个细胞(或细胞核)和用转座酶-核酸复合物官能化的单个珠粒(例如,凝胶珠粒)。然后使细胞以一种将模板核酸分子从细胞核释放到相应液滴中,但基本上保持天然染色质组织的方式裂解。然后使液滴(例如含水液滴)经受各种条件,使得转座酶-核酸复合物从珠粒(例如,凝胶珠粒)释放到相应液滴中(例如使用还原剂例如dtt解聚或降解珠粒)。虽然可以制备多种不同构型的转座酶-核酸复合物,但是转座酶-核酸复合物示出在图24a中并且显示包含转座酶、第一部分双链寡核苷酸和第二部分双链寡核苷酸的复合物。继续图24a的实施方案,第一部分双链寡核苷酸包含:(a)可释放地附接于珠粒(例如,凝胶珠粒)的第一链,其中第一链包含转座子末端序列(“me”)、条形码序列(“bc”)和第一测序引物序列(“r1”);以及(b)与第一寡核苷酸链的转座子末端序列互补的第二链(“merc”)。继续参考图24a,第二部分双链寡核苷酸包含:(a)第一寡核苷酸链,其包含转座子末端序列(“me”)和第二引物序列(“r2”);以及(b)与转座子末端序列互补的第二链(“merc”)。还参见图24b,其包含与上述实施方案相同的第一部分双链寡核苷酸和含有以下各项的第二部分双链寡核苷酸:(a)第一寡核苷酸链,其包含转座子末端序列(“me”)、条形码序列(“bc”)和第一引物序列(“r1”);以及(b)与第二寡核苷酸链的转座子末端序列互补的第二链(“merc”)。或者,如图26所示,制备珠粒(例如,凝胶珠粒)官能化转座酶-核酸复合物,所述图26示出包含转座酶、第一部分双链寡核苷酸和第二双链寡核苷酸的复合物。在此实施方案中,第一部分双链寡核苷酸包含:(a)可释放地附接于珠粒(例如,凝胶珠粒)的第一链,其中第一链包含转座子末端序列(“me”)和条形码序列(“bc”);以及(b)与第一寡核苷酸链的转座子末端序列互补的第二链(“merc”),而第二双链寡核苷酸包含:(a)可释放地附接于珠粒(例如,凝胶珠粒)的第一链,其中第一链包含转座子末端序列(“me);以及(b)与第一寡核苷酸链互补的第二链(“merc”)。图26的替代性实施方案包含额外功能序列,例如测序引物序列(例如r1和/或r2)或衔接子序列(例如p5和/或p7)。在其他实施方案中,分配液滴,使得至少一些液滴包含细胞裂解试剂、多个转座酶分子、单个细胞(或细胞核)以及包含条形码寡核苷酸(例如,核酸条形码分子)的单个珠粒(例如,凝胶珠粒),所述条形码寡核苷酸包含条形码序列(“bc”)和转座子末端序列(“me”)。参见例如图25a至图25b。然后使液滴经受各种条件,使得在分配区中形成包含转座酶分子和条形码寡核苷酸的转座酶核酸复合物。在转座酶-核酸复合物从珠粒(例如,凝胶珠粒)释放到液滴中(或者在实施方案例如图25a至图25b中在分配区中形成)之后,使液滴经受各种条件,以使得转座酶-核酸复合物将转座子末端序列整合到模板核酸中,并将模板核酸片段化成侧接第一和第二部分双链寡核苷酸的双链模板核酸片段。在替代性实施方案中,细胞(或细胞核)是透化/可渗透的,并且转座酶-核酸复合物进入细胞核以使模板核酸在其中片段化。然后将细胞(如果存在的话)裂解以释放双链模板核酸片段。因为转座酶-核酸复合物可仅作用于无核小体模板,所以双链模板核酸片段代表单个细胞或细胞核中可接近性染色质的全基因组区域。然后从液滴中收集双链模板核酸片段并大量处理以填充由转座反应形成的任何缺口并生成适用于下一代高通量测序的文库(例如使片段或其衍生物经受一个或多个反应(例如核酸扩增),以添加功能序列,从而促进illumina测序;参见例如图27)。然后根据任何合适的测序方案对完全构建的文库进行测序。实施例7.使用转座酶-核酸复合物和条形码化衔接子由单个细胞生成条形码化核酸片段(两步方案)分配多个转座酶核酸复合物和多个感兴趣的细胞(或者从感兴趣的细胞收获的多个细胞核),使得至少一些分配区(例如,液滴或孔)包含单个细胞(或细胞核)、包含转座子末端序列的多个转座酶核酸复合物以及包含条形码序列和测序引物序列的多个条形码寡核苷酸(例如,核酸条形码分子)(参见例如图28a至图28b)。在一些实施方案中,多个条形码寡核苷酸还包含转座子末端序列。在一些实施方案中,将多个条形码寡核苷酸附接于固体或半固体颗粒(例如,凝胶珠粒)(参见例如图28b)并分配,使得至少一些分配区(例如,液滴或孔)包含多个转座酶核酸复合物、单个细胞(或细胞核)和单个固体或半固体颗粒(例如,凝胶珠粒)。例如,在一些实施方案中,如先前所述生成液滴乳液分配区,使得至少一些液滴(例如,含水液滴)包含含有转座酶和一对双链寡核苷酸的转座酶-核酸复合物、细胞裂解试剂、单个细胞(或细胞核)以及包含条形码化衔接子的单个珠粒(例如,凝胶珠粒)。虽然可以制备多种不同构型的转座酶-核酸复合物,但是转座酶-核酸复合物示出在图28a中并且显示包含转座酶、含有转座子末端(“嵌合末端”或“me”)序列的第一双链寡核苷酸和含有转座子末端(“嵌合末端”或“me”)序列的第二双链寡核苷酸的复合物。然后使细胞(如果存在的话)以一种将模板核酸分子从细胞核释放到液滴(例如,含水液滴)中,但基本上保持天然染色质组织的方式裂解。然后使液滴经受各种条件,使得条形码化衔接子从珠粒(例如,凝胶珠粒)释放到相应液滴中。虽然可以制备多种不同构型的条形码化衔接子,但是示例性条形码化衔接子示出在图28b中并且显示包含转座子末端(“嵌合末端”或“me”)序列、条形码序列(“bc”)和可释放地附接于珠粒(例如,凝胶珠粒)的引物序列(“r1”)的单链寡核苷酸。在条形码化衔接子从珠粒(例如,凝胶珠粒)释放到液滴中之后,使液滴经受各种条件,以使得转座酶-核酸复合物将转座子末端序列整合到模板核酸中,并将模板核酸片段化成双链模板核酸片段。在替代性实施方案中,细胞(或细胞核)是透化/可渗透的,并且转座酶-核酸复合物进入细胞核以使模板核酸在其中片段化。然后将细胞(如果存在的话)裂解以释放双链模板核酸片段。因为转座酶-核酸复合物可仅作用于无核小体模板,所以双链模板核酸片段代表单个细胞或细胞核中可接近性染色质的全基因组区域。在转座和片段化之后,执行pcr反应,以填充由转座反应形成的任何缺口并且将条形码化衔接子添加到双链模板核酸片段的末端。然后从液滴中收集双链模板核酸片段并大量处理以生成适用于下一代高通量测序的文库(例如使片段或其衍生物经受一个或多个反应(例如核酸扩增),以添加功能序列,从而促进illumina测序)。然后根据任何合适的测序方案对完全构建的文库进行测序。实施例8.使用在单个反应步骤中组装的转座酶-核酸复合物生成条形码化核酸片段基于tn5的标签化系统的传统基于管的实施方式通常依赖于样品处理步骤,所述步骤在两个独立反应中发生,以生成最终转座酶片段化核酸样品。例如,在反应#1中,将含有tn5转座子末端序列的寡核苷酸衔接子和转座酶孵育,以形成转座酶-核酸复合物。通常,从反应缓冲液中省略镁(或其他二价阳离子),以使转座酶保持无催化活性。在反应#2中,将来自反应#1的转座酶-核酸复合物与靶标双链dna和含有镁(或其他二价阳离子)的适当反应缓冲液组合,以活化转座酶-核酸复合物并且引起靶标dna片段化和衔接子寡核苷酸序列的连接。虽然上述系列反应流程简单,但是在单个反应或反应容器(“一锅式反应”)内实施标签化反应可能较复杂。对50,000个hek293t细胞执行一锅式转座反应并且将其与传统两步标签化反应相比较。由每种反应类型制备测序文库并且在illumina测序仪上进行测序。测序数据呈现于以下表1中并且说明传统方法与一锅式标签化方法之间的可比较测序度量。表1.来自一锅式测序反应的结果测序度量传统一锅式总gb4331文库复杂度1.10.52中值插入物尺寸160180未映射分数0.0140.034非核读长分数0.530.26靶标上片段的分数0.570.81平均重复率1.51.8软分割的gt10bp的百分比读长0.250.17本文所述的转座方法可以用于如上所述的一锅式反应中。这些一锅式反应可以大量进行或在离散的分配区例如孔或液滴中进行。实施例9.使用本体标签化并通过在分配区中连接进行条形码化来生成条形码化核酸片段(变体1)从感兴趣的细胞群的细胞中以基本上保持天然染色质组织的方式大量收获完整细胞核(例如使用igepalca-630介导的细胞裂解)。然后在包含转座酶分子和两个部分双链衔接子寡核苷酸的转座酶-核酸复合物存在下孵育细胞核。参见例如图29a。或者,细胞是可渗透/透化的,使转座酶-核酸复合物接近细胞核。第一衔接子寡核苷酸包含双链转座子末端序列(“me”)和单链读长1测序引物序列(“r1”),而第二衔接子寡核苷酸包含双链转座子末端序列(“me”)和单链读长2测序引物序列(“r2”)。参见图29a。在一些实施方案中,第一和/或第二衔接子寡核苷酸中的r1和/或r2测序引物包含truseqr1和/或r2序列或其部分。转座酶-核酸复合物将衔接子整合到模板核酸中并产生侧接部分双链衔接子的模板核酸片段。参见图29c。因为转座酶-核酸复合物可仅作用于无核小体模板,所以片段化模板核酸片段代表可接近性染色质的全基因组区域。在一些实施方案中,在进一步处理步骤之前使转座酶分子失活。然后将包含衔接子侧接模板核酸片段的细胞核(或细胞)分配到多个分配区(例如,液滴或孔)中,使得至少一些分配区包含(1)单个细胞核(或细胞),其包含衔接子侧接模板核酸片段;和(2)多个部分双链条形码寡核苷酸分子,其包含双链条形码序列(“bc”)、双链p5衔接子序列(“p5”)和与读长1序列互补的单链序列(“r1rc”)。参见图29b。在一些实施方案中,将部分双链条形码寡核苷酸分子附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并分配,使得至少一些分配区(例如,液滴或孔)包含(1)单个细胞核(或细胞)和(2)单个固体或半固体颗粒(例如珠粒,例如凝胶珠粒)。除上述组分之外,在一些实施方案中,多个分配区(例如,液滴或孔)还包含促进下述反应的试剂(例如酶和缓冲液)。然后使含有单个细胞或细胞核的分配区(例如,液滴或孔)经受各种条件,以从细胞核释放衔接子侧接模板核酸片段(例如,细胞裂解)。在某些实施方案中,在将条形码寡核苷酸(例如,核酸条形码分子)附接于珠粒(例如,凝胶珠粒)时,使分配区(例如,液滴或孔)经受各种条件,以引起条形码寡核苷酸分子从珠粒(例如,凝胶珠粒)释放(例如,例如使用还原剂例如dtt解聚或降解珠粒)。在从单个细胞核释放之后,使衔接子侧接模板核酸片段经受各种条件,以使读长1序列的5'端磷酸化(例如使用t4多核苷酸激酶),以用于后续连接步骤。在磷酸化之后,使用适合dna连接酶(例如t4或大肠杆菌dna连接酶)和条形码寡核苷酸中的互补读长1序列以及衔接子侧接模板核酸片段将条形码寡核苷酸分子连接到衔接子侧接模板核酸片段上。参见图29c。在条形码连接之后,填充从转座反应保留的缺口,以产生条形码化衔接子侧接模板核酸片段。参见图29c。然后从分配区(例如,液滴或孔)中释放条形码化衔接子侧接模板核酸片段并且大量处理,以完成用于下一代高通量测序的文库制备(例如,以添加样品索引(si)序列(例如“i7”)和/或进一步添加衔接子序列(例如“p7”))。在替代性实施方案中,在条形码化衔接子侧接模板核酸片段已从分配区(例如,液滴或孔)释放之后大量完成缺口填充反应。然后根据合适的下一代测序方案(例如illumina测序)对完全构建的文库进行测序。实施例10.使用标签化并通过在分配区中连接进行条形码化来生成条形码化核酸片段将来自感兴趣的细胞群的细胞(或来自感兴趣的细胞群的细胞的细胞核)分配到多个分配区(例如,液滴或孔)中,使得至少一些分配区包含(1)单个细胞(或单个细胞核),其包含模板核酸;和(2)多个部分双链条形码寡核苷酸分子(例如,核酸条形码分子),其包含双链条形码序列(“bc”)、双链p5衔接子序列(“p5”)和与读长1序列互补的单链序列(“r1rc”)。(参见图29b)。在一些实施方案中,将部分双链条形码寡核苷酸分子附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并分配,使得至少一些分配区(例如,液滴或孔)包含(1)单个细胞(或单个细胞核)和(2)单个固体或半固体颗粒(例如,凝胶珠粒)。除上述组分之外,在一些实施方案中,多个分配区(例如,液滴或孔)还包含促进下述反应的试剂(例如酶和缓冲液)。在分配到分配区(例如,液滴或孔)中之后,将单个细胞(或细胞核)裂解,以便以基本上保持天然染色质组织的方式释放模板基因组dna。然后使分配区(例如,液滴或孔)经受各种条件,以生成如实施例9所述且如图29a所示的转座酶-核酸复合物。或者,在一些实施方案中,将如图29a所示的多个预形成的转座酶-核酸复合物分配到多个分配区(例如,液滴或孔)中。然后使分配区(例如,液滴或孔)经受各种条件,使得转座酶-核酸复合物将第一和第二衔接子序列整合到模板核酸中,以生成双链衔接子侧接的模板核酸片段。参见图29d。因为转座酶-核酸复合物可仅作用于无核小体dna,所以衔接子侧接模板核酸片段代表单个细胞或细胞核中可接近性染色质的全基因组区域。或者,在一些实施方案中,在完整细胞核中执行标签化反应,并且在转座之后将细胞核裂解,以释放双链衔接子侧接模板核酸片段。然后大体如实施例9所述处理样品。在某些实施方案中,在将条形码寡核苷酸(例如,核酸条形码分子)附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)时,使液滴经受各种条件,以引起条形码寡核苷酸分子从固体或半固体颗粒(例如,凝胶珠粒)释放(例如,例如使用还原剂例如dtt解聚或降解珠粒)。在一些实施方案中,在进一步处理步骤之前使转座酶分子失活(例如,通过热失活)。使衔接子侧接模板核酸片段经受各种条件,以使衔接子侧接模板核酸片段的读长1序列的5’端磷酸化(例如使用t4多核苷酸激酶)。在磷酸化之后,使用适合dna连接酶(例如t4、9°n或大肠杆菌dna连接酶)和条形码寡核苷酸中的互补读长1序列以及衔接子侧接模板核酸片段将条形码寡核苷酸分子连接到衔接子侧接模板核酸片段上。参见图29c。在条形码连接之后,填充从转座反应保留的缺口,以产生条形码化衔接子侧接模板核酸片段。参见图29c。然后从分配区(例如,液滴或孔)中释放条形码化衔接子侧接模板核酸片段并且大量处理,以完成用于下一代高通量测序的文库制备(例如,以添加样品索引(si)序列(例如“i7”)和/或进一步添加衔接子序列(例如“p7”))。在替代性实施方案中,在条形码化衔接子侧接模板核酸片段已从液滴释放之后大量完成缺口填充反应。然后根据合适的下一代测序方案(例如illumina测序)对完全构建的文库进行测序。实施例11.使用本体标签化并通过在分配区中的线性扩增进行条形码化来生成条形码化核酸片段从感兴趣的细胞群的细胞中以基本上保持天然染色质组织的方式大量收获细胞核。或者,细胞是透化/可渗透的,使转座酶-核酸复合物接近细胞核。然后在如实施例9所述的转座酶-核酸复合物存在下孵育细胞核(或透化细胞)。参见图29a。然后将包含衔接子侧接模板核酸片段的细胞核(或细胞)分配到多个分配区(例如,液滴或孔)中,使得至少一些分配区包含(1)单个细胞核(或细胞),其包含衔接子侧接模板核酸片段;和(2)多个单链条形码寡核苷酸分子(例如,核酸条形码分子),其包含转座子末端序列(“me”)、读长1序列(“r1”)或其部分、条形码序列(“bc”)以及p5衔接子序列(“p5”)。参见图30a。在一些实施方案中,将单链条形码寡核苷酸分子附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并分配,使得至少一些分配区(例如,液滴或孔)包含(1)含有衔接子侧接模板核酸片段的单个细胞核(或细胞)和(2)单个固体或半固体颗粒(例如,凝胶珠粒)。除上述组分之外,在一些实施方案中,多个分配区(例如,液滴或孔)还包含促进下述反应的试剂(例如酶和缓冲液)。然后使含有单个细胞或细胞核的分配区(例如,液滴或孔)经受各种条件,以从细胞核释放衔接子侧接模板核酸片段。在衔接子侧接模板核酸片段释放之后,用适合酶填充来自转座反应的缺口。参见图30b。在某些实施方案中,在将条形码寡核苷酸(例如,核酸条形码分子)附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)时,使分配区(例如,液滴或孔)经受各种条件,以引起条形码寡核苷酸分子从固体或半固体颗粒(例如珠粒,例如凝胶珠粒)释放(例如,例如使用还原剂例如dtt解聚或降解珠粒)。然后使缺口填充的衔接子侧接的模板核酸片段经受使用单链条形码寡核苷酸分子作为引物的线性扩增反应,以产生条形码化衔接子侧接模板核酸片段。参见图30b。然后从分配区(例如,液滴或孔)中释放条形码化衔接子侧接模板核酸片段并且大量处理,以完成用于下一代高通量测序的文库制备(例如,以添加样品索引(si)序列(例如“i7”)和/或进一步添加衔接子序列(例如“p7”))。然后根据适合的下一代测序方案(例如illumina测序)对完全构建的文库进行测序。实施例12.使用标签化并通过在分配区中的线性扩增进行条形码化来生成条形码化核酸片段将来自感兴趣的细胞群的细胞(或来自感兴趣的细胞群的细胞的完整细胞核)分配到多个分配区(例如,液滴或孔)中,使得至少一些分配区包含(1)单个细胞(或单个细胞核),其包含模板核酸;和(2)多个单链条形码寡核苷酸分子(例如,核酸条形码分子),其包含转座子末端序列(“me”)、读长1序列(“r1”)、条形码序列(“bc”)和p5衔接子序列(“p5”)。参见例如图30a。在一些实施方案中,将单链条形码寡核苷酸分子附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并分配,使得至少一些分配区(例如,液滴或孔)包含(1)单个细胞(或单个细胞核)和(2)单个固体或半固体颗粒(例如珠粒,例如凝胶珠粒)。除上述组分之外,在一些实施方案中,多个分配区(例如,液滴或孔)还包含促进下述反应的试剂(例如酶和缓冲液)。在分配到分配区(例如,液滴或孔)中之后,将单个细胞(或细胞核)裂解,以便以基本上保持天然染色质组织的方式释放模板基因组dna。在某些实施方案中,在将条形码寡核苷酸(例如,核酸条形码分子)附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)时,使分配区(例如,液滴或孔)经受各种条件,以引起条形码寡核苷酸分子从固体或半固体颗粒(例如珠粒,例如凝胶珠粒)释放(例如,例如使用还原剂例如dtt解聚或降解珠粒)。然后使分配区(例如,液滴或孔)经受各种条件,以生成如实施例9所述且如图29a所示的转座酶-核酸复合物。或者,在一些实施方案中,将如图29a所示的多个预形成的转座酶-核酸复合物分配到多个分配区(例如,液滴或孔)中。然后使分配区(例如,液滴或孔)经受各种条件,使得转座酶-核酸复合物将第一和第二衔接子序列整合到模板核酸中,以生成双链衔接子侧接的模板核酸片段。因为转座酶-核酸复合物可仅作用于无核小体dna,所以衔接子侧接模板核酸片段代表单个细胞或细胞核中可接近性染色质的全基因组区域。或者,在一些实施方案中,在完整细胞核中执行标签化反应,并且将细胞核裂解,以释放双链衔接子侧接模板核酸片段。然后大体如实施例11所述处理样品。在标签化之后,用适合缺口填充酶填充来自转座反应的缺口。参见图31。然后使缺口填充的衔接子侧接的模板核酸片段经受使用单链条形码寡核苷酸分子作为引物的线性扩增反应,以产生条形码化衔接子侧接模板核酸片段。参见图31。然后从分配区(例如,液滴或孔)中释放条形码化衔接子侧接模板核酸片段并且大量处理,以完成用于下一代高通量测序的文库制备(例如,以添加样品索引(si)序列(例如“i7”)和/或进一步添加衔接子序列(例如“p7”))。然后根据适合的下一代测序方案(例如illumina测序)对完全构建的文库进行测序。实施例13.使用本体标签化和在分配区中的crispr/cas9切割来生成条形码化核酸片段从感兴趣的细胞群的细胞中以基本上保持天然染色质组织的方式大量收获细胞核。或者,细胞是透化/可渗透的,使转座酶-核酸复合物接近细胞核。然后在如实施例9所述的转座酶-核酸复合物存在下孵育细胞核。参见图29a。在一些实施方案中,在转座之后,使转座酶失活或者使其与衔接子侧接模板核酸片段解离。然后将包含衔接子侧接模板核酸片段的细胞核(或细胞)分配到多个分配区(例如,液滴或孔),使得至少一些分配区包含(1)单个细胞核,其包含衔接子侧接模板核酸片段;(2)多个双链条形码寡核苷酸分子(例如,核酸条形码分子),其包含条形码序列(bc)和truseqr1测序引物序列(例如图32a);和(3)多个crispr/cas9复合物,其包含cas9核酸酶和靶向衔接子侧接模板核酸片段中的读长1/me衔接子序列的合成指导rna(grna)。参见图32b。在一些实施方案中,将双链条形码寡核苷酸分子(例如,核酸条形码分子)附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并分配,使得至少一些液滴包含(1)单个细胞核;(2)单个固体或半固体颗粒(例如,凝胶珠粒);和(3)多个crispr/cas9复合物。除上述组分之外,在一些实施方案中,多个分配区(例如,液滴或孔)还包含促进下述反应的试剂(例如酶和缓冲液)。然后使含有单个细胞核的分配区(例如,液滴或孔)经受各种条件,以从细胞核释放衔接子侧接模板核酸片段。在衔接子侧接模板核酸片段释放之后,用适合缺口填充酶填充来自转座反应的缺口。然后使缺口填充的衔接子侧接的模板核酸片段经受r1/me衔接子或其相同部分的cas9-介导的切割。参见图32b。在某些实施方案中,在将条形码寡核苷酸(例如,核酸条形码分子)附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)时,使分配区(例如,液滴或孔)经受各种条件,以引起条形码寡核苷酸分子从固体或半固体颗粒(例如,凝胶珠粒)释放(例如,例如使用还原剂例如dtt解聚或降解珠粒)。然后将条形码寡核苷酸连接到模板核酸片段的r1衔接子切割的末端上,以产生条形码化衔接子侧接模板核酸片段。参见图32b。然后从分配区(例如,液滴或孔)中释放条形码化衔接子侧接模板核酸片段并大量处理以完成用于下一代高通量测序的文库制备(例如使片段或其衍生物经受一个或多个反应(例如核酸扩增),以添加功能序列,从而促进illumina测序)。在一些实施方案中,在分配区中或在从分配区释放之后大量执行使用靶向读长2/me衔接子序列的合成指导rna(grna)的第二crispr/cas9介导的裂解事件。然后根据任何合适的测序方案对完全构建的文库进行测序。实施例14.使用标签化和在分配区中的crispr/cas9切割来生成条形码化核酸片段将来自感兴趣的细胞群的细胞(或来自感兴趣的细胞群中的细胞的完整细胞核)分配到多个分配区(例如,液滴或孔),使得至少一些分配区包含(1)单个细胞(或单个细胞核),其包含模板核酸;(2)多个双链条形码寡核苷酸分子(例如,核酸条形码分子),其包含条形码序列(“bc”)和truseqr1测序引物序列(例如图32a);和(3)多个crispr/cas9复合物,其包含cas9核酸酶和靶向衔接子侧接模板核酸片段中的读长1/me衔接子序列的合成指导rna(grna)。参见例如图32c。在一些实施方案中,将双链条形码寡核苷酸分子(例如,核酸条形码分子)附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并分配,使得至少一些分配区(例如,液滴或孔)包含(1)单个细胞(或单个细胞核);(2)单个固体或半固体颗粒(例如,凝胶珠粒);和(3)多个crispr/cas9复合物。除上述组分之外,在一些实施方案中,多个分配区(例如,液滴或孔)还包含促进下述反应的试剂(例如酶和缓冲液)。在分配到分配区(例如,液滴或孔)中之后,将单个细胞(或细胞核)裂解,以便以基本上保持天然染色质组织的方式释放模板基因组dna。然后使分配区(例如,液滴或孔)经受各种条件,以生成如实施例9所述且如图29a所示的转座酶-核酸复合物。或者,在一些实施方案中,将如图29a所示的多个预形成的转座酶-核酸复合物分配到多个分配区(例如,液滴或孔)中。然后使分配区(例如,液滴或孔)经受各种条件,使得转座酶-核酸复合物将第一和第二衔接子序列整合到模板核酸中,以生成双链衔接子侧接的模板核酸片段。因为转座酶-核酸复合物可仅作用于无核小体dna,所以衔接子侧接模板核酸片段代表单个细胞或细胞核中可接近性染色质的全基因组区域。或者,在一些实施方案中,在完整细胞核中执行标签化反应,并且将细胞核裂解,以释放双链衔接子侧接模板核酸片段。然后大体如实施例13所述处理样品。在标签化之后,用适合缺口填充酶填充来自转座反应的缺口。参见图32c。然后使缺口填充的衔接子侧接的模板核酸片段经受r1衔接子的cas9-介导的切割。参见图32c。在某些实施方案中,在将条形码寡核苷酸(例如,核酸条形码分子)附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)时,使分配区(例如,液滴或孔)经受各种条件,以引起条形码寡核苷酸分子从固体或半固体颗粒(例如,凝胶珠粒)释放(例如,例如使用还原剂例如dtt解聚或降解珠粒)。然后将条形码寡核苷酸连接到模板核酸片段的r1衔接子切割的末端上,以产生条形码化衔接子侧接模板核酸片段。参见图32c。然后从分配区(例如,液滴或孔)中释放条形码化衔接子侧接模板核酸片段并大量处理以完成用于下一代高通量测序的文库制备(例如使片段或其衍生物经受一个或多个反应(例如核酸扩增),以添加功能序列,从而促进illumina测序)。在一些实施方案中,在分配区中或在从分配区释放之后大量执行使用靶向读长2/me衔接子序列的合成指导rna(grna)的第二crispr/cas9介导的裂解事件。然后根据任何合适的测序方案对完全构建的文库进行测序。实施例15.使用本体标签化和在分配区中的crispr/cas9切割使用y-衔接子来生成条形码化核酸片段从感兴趣的细胞群的细胞中以基本上保持天然染色质组织的方式大量收获细胞核。或者,细胞是透化/可渗透的,使转座酶-核酸复合物接近细胞核。然后在如实施例9所述的转座酶-核酸复合物存在下孵育细胞核。参见图29a。在一些实施方案中,在转座之后,使转座酶失活或者使其与衔接子侧接模板核酸片段解离。然后将包含衔接子侧接模板核酸片段的细胞核(或细胞)分配到多个分配区(例如,液滴或孔),使得至少一些分配区包含(1)单个细胞核,其包含衔接子侧接模板核酸片段;(2)多个y-衔接子条形码寡核苷酸分子(例如,核酸条形码分子),其包含条形码序列(“bc”)、读长1测序引物序列和truseqr1测序引物序列(“r1”)和读长2测序引物序列(“r2”),例如图33a;(3)第一多个crispr/cas9复合物,其包含cas9核酸酶和靶向衔接子侧接模板核酸片段中的读长1/me衔接子序列的合成指导rna(grna);和(4)第二多个crispr/cas9复合物,其包含cas9核酸酶和靶向衔接子侧接模板核酸片段中的读长2/me衔接子序列的合成指导rna(grna)。参见图33c。在一些实施方案中,将y-衔接子条形码寡核苷酸分子附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)(例如图15a)并分配,使得至少一些分配区(例如,液滴或孔)包含(1)单个细胞核;(2)单个固体或半固体颗粒(例如珠粒,例如凝胶珠粒);(3)第一多个crispr/cas9复合物;和(4)第二多个crispr/cas9复合物。除上述组分之外,在一些实施方案中,多个分配区(例如,液滴或孔)还包含促进下述反应的试剂(例如酶和缓冲液)。然后使含有单个细胞核的分配区(例如,液滴或孔)经受各种条件,以从细胞核释放衔接子侧接模板核酸片段。在衔接子侧接模板核酸片段释放之后,用适合缺口填充酶填充来自转座反应的缺口。然后使缺口填充的衔接子侧接的模板核酸片段经受r1和r2衔接子或其部分的cas9-介导的切割。参见图33b。在某些实施方案中,在将条形码寡核苷酸(例如,核酸条形码分子)附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)时,使分配区(例如,液滴或孔)经受各种条件,以引起条形码寡核苷酸分子从固体或半固体颗粒(例如,凝胶珠粒)释放(例如,例如使用还原剂例如dtt解聚或降解珠粒)。然后将y-衔接子条形码寡核苷酸连接到模板核酸片段的r1/r2衔接子切割的末端上,以产生条形码化衔接子侧接模板核酸片段。参见图33b。然后从分配区(例如,液滴或孔)中释放条形码化衔接子侧接模板核酸片段并大量处理以完成用于下一代高通量测序的文库制备(例如使片段或其衍生物经受一个或多个反应(例如核酸扩增),以添加功能序列,从而促进illumina测序)。然后根据任何合适的测序方案对完全构建的文库进行测序。实施例16.使用标签化和在分配区中的crispr/cas9切割使用y-衔接子来生成条形码化核酸片段将来自感兴趣的细胞群的细胞(或来自感兴趣的细胞群中的细胞的完整细胞核)分配到多个分配区(例如,液滴或孔),使得至少一些分配区包含(1)单个细胞(或单个细胞核),其包含模板核酸;(2)多个y-衔接子条形码寡核苷酸分子(例如,核酸条形码分子),其包含条形码序列(“bc”)、读长1测序引物序列(“r1”)和读长2测序引物序列(“r2”)(例如图33a);(3)第一多个crispr/cas9复合物,其包含cas9核酸酶和靶向衔接子侧接模板核酸片段中的读长1/me衔接子序列的合成指导rna(grna);和(4)第二多个crispr/cas9复合物,其包含cas9核酸酶和靶向衔接子侧接模板核酸片段中的读长2/me衔接子序列的合成指导rna(grna)。参见图33c。在一些实施方案中,将y-衔接子条形码寡核苷酸分子附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并分配,使得至少一些分配区(例如,液滴或孔)包含(1)单个细胞(或单个细胞核);(2)单个固体或半固体颗粒(例如,凝胶珠粒);(3)第一多个crispr/cas9复合物;和(4)第二多个crispr/cas9复合物。除上述组分之外,在一些实施方案中,多个分配区(例如,液滴或孔)还包含促进下述反应的试剂(例如酶和缓冲液)。在分配到分配区(例如,液滴或孔)中之后,将单个细胞(或细胞核)裂解,以便以基本上保持天然染色质组织的方式释放模板基因组dna。然后使分配区(例如,液滴或孔)经受各种条件,以生成如实施例9所述且如图29a所示的转座酶-核酸复合物。或者,在一些实施方案中,将如图29a所示的多个预形成的转座酶-核酸复合物分配到多个分配区(例如,液滴或孔)中。然后使分配区(例如,液滴或孔)经受各种条件,使得转座酶-核酸复合物将第一和第二衔接子序列整合到模板核酸中,以生成双链衔接子侧接的模板核酸片段。因为转座酶-核酸复合物可仅作用于无核小体dna,所以衔接子侧接模板核酸片段代表单个细胞或细胞核中可接近性染色质的全基因组区域。或者,在一些实施方案中,在完整细胞核中执行标签化反应,并且将细胞核裂解,以释放双链衔接子侧接模板核酸片段。然后大体如实施例15所述处理样品。在标签化之后,用适合缺口填充酶填充来自转座反应的缺口。参见图33c。然后使缺口填充的衔接子侧接的模板核酸片段经受r1和r2衔接子或其部分的cas9-介导的切割。参见图33c。在某些实施方案中,在将条形码寡核苷酸(例如,核酸条形码分子)附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)时,使分配区(例如,液滴或孔)经受各种条件,以引起条形码寡核苷酸分子从固体或半固体颗粒(例如,凝胶珠粒)释放(例如,例如使用还原剂例如dtt解聚或降解珠粒)。然后将y-衔接子条形码寡核苷酸连接到模板核酸片段的r1/r2衔接子切割的末端上,以产生条形码化衔接子侧接模板核酸片段。参见图33c。然后从分配区(例如,液滴或孔)中释放条形码化衔接子侧接模板核酸片段并大量处理以完成用于下一代高通量测序的文库制备(例如使片段或其衍生物经受一个或多个反应(例如核酸扩增),以添加功能序列,从而促进illumina测序)。然后根据任何合适的测序方案对完全构建的文库进行测序。实施例17.由相同单个细胞生成atac-seq和条形码化cdna的条形码化核酸分子将来自感兴趣的细胞群的细胞(或来自感兴趣的细胞群的细胞的完整细胞核)分配到多个分配区(例如,液滴或孔),使得至少一些分配区包含(1)单个细胞(或单个细胞核),其包含模板基因组dna分子和模板rna分子;(2)多个第一条形码化寡核苷酸分子(例如,第一核酸条形码分子),其包含条形码序列;(3)多个转座酶分子,(4)多个第二条形码寡核苷酸分子(例如,第二核酸条形码分子),其包含条形码序列和捕获序列;和(5)多个逆转录酶分子。在一些实施方案中,来自第一条形码化寡核苷酸的条形码序列和来自第二条形码化寡核苷酸的条形码序列是相同的。在一些实施方案中,来自第一条形码化寡核苷酸的条形码序列和来自第二条形码化寡核苷酸的条形码序列是不同的。在一些实施方案中,将多个第一条形码化寡核苷酸(例如,第一核酸条形码分子)和多个第二条形码化寡核苷酸(例如,第二核酸条形码分子)附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并分配,使得至少一些分配区(例如,液滴或孔)包含(1)单个细胞(或单个细胞核);(2)单个固体或半固体颗粒(例如,凝胶珠粒),其包含第一和第二多个条形码化寡核苷酸;(3)多个转座酶分子;和(4)多个逆转录酶分子。在其他实施方案中,将多个第一条形码化寡核苷酸(例如,第一核酸条形码分子)附接于第一固体或半固体颗粒(例如珠粒,例如凝胶珠粒),同时将多个第二条形码化寡核苷酸(例如,第二核酸条形码分子)附接于第二固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并分配,使得至少一些分配区(例如,液滴或孔)包含(1)单个细胞(或单个细胞核);(2)单个第一固体或半固体颗粒(例如,凝胶珠粒);(2)单个第二固体或半固体颗粒(例如,凝胶珠粒);(3)多个转座酶分子;和(4)多个逆转录酶分子。在某些实施方案中,将多个第一条形码化寡核苷酸(例如,第一核酸条形码分子)附接于多个固体或半固体颗粒(例如珠粒,例如凝胶珠粒),同时将多个第二条形码化寡核苷酸(例如,第二核酸条形码分子)附接于多个磁性颗粒(例如,珠粒),其中所述多个磁性颗粒嵌入在固体或半固体颗粒(例如,凝胶珠粒)内。继续这些实施方案,分配多个固体或半固体颗粒(例如,凝胶珠粒),使得至少一些分配区(例如,液滴或孔)包含:(1)单个细胞(或单个细胞核);(2)单个固体或半固体颗粒(例如,凝胶珠粒),其包含(i)附接于单个固体或半固体颗粒(例如,凝胶珠粒)的多个第一条形码化寡核苷酸;和(ii)多个嵌入在单个固体或半固体颗粒(例如,凝胶珠粒)内的磁性颗粒,其中所述磁性颗粒包含附接于其中的第二条形码寡核苷酸;(3)多个转座酶分子;以及(4)多个逆转录酶分子。参见例如图34。类似地,在其他实施方案中,将第二条形码化寡核苷酸(例如,第二核酸条形码分子)附接于固体或半固体颗粒(例如,凝胶珠粒),同时将第一寡核苷酸(例如,第一核酸条形码分子)附接于多个嵌入在固体或半固体颗粒(例如,凝胶珠粒)内的磁性颗粒。参见例如图34。除上述组分之外,在一些实施方案中,多个分配区(例如,液滴或孔)还包含促进本文所述反应的试剂(例如酶和缓冲液)。第一条形码化寡核苷酸和相关核酸处理步骤可以采用任何上述实施例的结构并且可包括如其中所述的额外组分。例如,在一些实施方案中,第一条形码化寡核苷酸包含条形码序列和转座子末端序列(例如me序列)并且例如是(1)叉状衔接子,例如实施例1,图12a至图12b所述的那些;(2)含有t7的寡核苷酸,例如实施例3,图18所述的那些;或者(3)条形码化寡核苷酸,例如(i)实施例7,图28b;(ii)实施例11,图30a至图30b;以及(iii)实施例12,图31所述的那些。在其他实施方案中,第一条形码化寡核苷酸包含条形码序列并且例如是(1)叉状衔接子,例如实施例2,图15a至图15b或实施例15-16,图33a至图33c所述的那些;或者(2)条形码化寡核苷酸,例如实施例9和10,图29a至图29c或实施例13-14,图32a至图32c所述的那些。在一些情况下,第二条形码化寡核苷酸包含第二条形码序列和捕获序列,其中捕获序列可以是例如聚-t序列、随机引物序列(例如,随机六聚体)或基因特异性序列。在分配到分配区(例如,液滴或孔)中之后,将单个细胞(或细胞核)裂解,以便以基本上保持基因组dna的天然染色质组织的方式释放模板基因组dna和模板rna(例如细胞质mrna或细胞核mrna)。在某些实施方案中,在将条形码寡核苷酸附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)时,使分配区(例如,液滴或孔)经受各种条件,以引起条形码寡核苷酸分子从固体或半固体颗粒(例如,凝胶珠粒)释放(例如,例如使用还原剂例如dtt解聚或降解珠粒)。然后使分配区(例如,液滴或孔)经受各种条件,以生成如上述实施例所述的转座酶-核酸复合物。或者,在一些实施方案中,将多个预形成的转座酶-核酸复合物分配到多个分配区(例如,液滴或孔)中。然后使分配区(例如,液滴或孔)经受各种条件,使得转座酶-核酸复合物生成双链模板基因组dna片段。如上所述,转座反应可以采用任何上述实施例的结构,以生成侧接多种功能序列并适用于许多下游处理步骤的双链模板基因组dna片段。例如,如本文所述,在一些实施方案中,转座反应将条形码序列直接整合到模板基因组dna片段中(例如,实施例1),而在其他实施方案中,条形码序列在转座反应后被添加到模板基因组dna片段中(例如通过连接,例如实施例2)。因为转座酶-核酸复合物可仅作用于无核小体dna,所以模板基因组dna片段代表单个细胞或细胞核中可接近性染色质的全基因组区域。或者,在一些实施方案中,在完整细胞核中进行转座反应,并且将细胞核裂解,以释放衔接子侧接的模板基因组dna片段。或者,在一些实施方案中,在完整细胞核中大量执行转座反应并且分配包含模板基因组dna片段的单个细胞核并如上所述处理。在一些实施方案中,在液滴中用适合缺口填充酶填充来自转座反应的缺口。在其他实施方案中,在已从分配区释放双链条形码化衔接子侧接dna片段之后,大量执行缺口填充反应。在一些情况下,可以使分配区(例如,液滴或孔)经受各种条件,以使用多个第二条形码化寡核苷酸的第二条形码化寡核苷酸的捕获序列捕获第二固体或半固体颗粒上的模板rna(例如,信使rna,mrna)。或者,多个第二条形码化寡核苷酸的第二条形码化寡核苷酸可以从第二固体或半固体颗粒(例如,如本文所述)释放并用于捕获模板rna。随后可以在从分配区移除之后大量处理捕获的模板rna。或者,在一些情况下,可以使分配区(例如,液滴或孔)经受各种条件,以使用来自第二条形码寡核苷酸的捕获序列由模板rna生成单链条形码化cdna分子以引发逆转录反应(例如,寡聚(dt)序列)。在一些实施方案中,产生第二链cdna(例如,通过模板转换寡核苷酸或通过随机引发),以生成双链条形码化cdna分子。在一些实施方案中,模板转换寡核苷酸还包含条形码序列,使得cdna的5'端和3'端二者均包含条形码序列。在5'端和3'端上的条形码序列可以是相同的条形码序列,或者5'端可以具有与3'端不同的条形码序列。在其他实施方案中,省略多个第二条形码寡核苷酸分子并用多个包含捕获序列且无条形码序列的第二寡核苷酸分子替代。继续这些实施方案,使用捕获序列生成第一链cdna分子,同时通过使用条形码化模板转换寡核苷酸生成第二链cdna以使模板rna的5'端条形码化。在一些实施方案中,对衔接子侧接的dna片段、条形码化cdna分子或衔接子侧接的dna片段和条形码化cdna分子两者执行分配区内(例如,液滴内或孔内)扩增反应,例如线性扩增。在一些实施方案中,将条形码寡核苷酸直接连接到模板rna上。示例性方案1-使用连接的scatac-seq+3'scrna-seq在示例性条形码化方案中,将来自感兴趣的细胞群的细胞(或来自感兴趣的细胞群中的细胞的完整细胞核)分配到多个分配区(例如,液滴或孔),使得至少一些分配区包含:(1)单个细胞(或单个细胞核),其包含模板基因组dna分子和模板rna分子(例如,mrna或核前mrna);(2)固体或半固体颗粒(例如珠粒,例如凝胶珠粒),其包含(i)如图29b(还参见图35a)所示的多个部分双链核酸条形码分子和(ii)如图35b所示的多个核酸条形码分子;(3)多个转座酶分子;(4)包含转座酶末端序列的多个核酸分子(例如,图29a);和(5)多个逆转录酶分子。在一些实施方案中,固体或半固体颗粒是珠粒。在一些实施方案中,珠粒是凝胶珠粒。在一些实施方案中,固体或半固体颗粒(例如,凝胶珠粒)包含图35a的附接于其中的多个部分双链核酸条形码分子和嵌入在固体或半固体颗粒(例如,凝胶珠粒)中的多个磁性颗粒(参见例如图34),其中多个磁性颗粒包括附接于其中的图35b的多个核酸条形码分子。在其他实施方案中,固体或半固体颗粒(例如,凝胶珠粒)包含图35b的附接于其中的多个核酸条形码分子和嵌入在固体或半固体颗粒(例如,凝胶珠粒)中的多个磁性颗粒,其中多个磁性颗粒包括附接于其中的图35a的多个核酸条形码分子。在一些实施方案中,图35a中的条形码序列和图35b中的条形码序列是相同的。在一些实施方案中,图35a中的条形码序列和图35b中的条形码序列包含相同的一个或多个条形码区段。在一些实施方案中,图35a中的条形码序列和图35b中的条形码序列是不同的。继续这些实施方案,在分配之后,将单个细胞(或细胞核)裂解,以便以基本上保持基因组dna的天然染色质组织的方式释放模板基因组dna和模板rna(例如细胞质mrna或细胞核mrna)。在某些实施方案中,将图35a和图35b的多个核酸条形码分子可释放地附接于固体或半固体颗粒(例如珠粒)并且使分配区(例如,液滴或孔)经受各种条件,以引起条形码寡核苷酸分子从固体或半固体颗粒(例如珠粒)释放(例如,例如使用还原剂例如dtt解聚或降解珠粒)。然后使分配区(例如,液滴或孔)经受各种条件,以生成如上述实施例所述的转座酶-核酸复合物。或者,在一些实施方案中,将多个预形成的转座酶-核酸复合物(例如图29a)分配到多个分配区(例如,液滴或孔)中。然后使分配区经受各种条件,使得转座酶-核酸复合物生成双链模板基因组dna片段。或者,在一些实施方案中,在分配的完整细胞核中大量执行转座反应,使得至少一些分配区(例如,液滴或孔)包含(1)单个细胞(或单个细胞核),其包含模板基因组dna片段和模板rna分子;(2)固体或半固体颗粒(例如珠粒,例如凝胶珠粒),其包含(i)如图29b(还参见图35a)所示的多个部分双链核酸条形码分子和(ii)如图35b所示的多个核酸条形码分子;以及(3)多个逆转录酶分子。在一些实施方案中,将图35a和图35b的核酸条形码分子附接于嵌入在如先前所述的固体或半固体颗粒(例如珠粒,例如凝胶珠粒)内的磁性颗粒。在分配之后,单个细胞核裂解以释放模板基因组dna片段和模板rna(例如,细胞质mrna或细胞核mrna)分子。继续此实施方案,在片段化后,大体通过将如图29b(还参见图35a)所示的部分双链核酸条形码分子连接至模板核酸片段来如图29d(或图29c,用于本体标签化)所概述处理模板基因组dna片段(参见例如实施例9和10)。使用逆转录酶,用图35b的多个核酸条形码分子处理包含聚-a尾的模板rna分子(例如,mrna分子),以生成如本文任何其他位置大体描述的条形码化cdna分子。示例性方案2-使用连接的scatac-seq+5'scrna-seq在另一个条形码化方案中,将来自感兴趣的细胞群的细胞(或来自感兴趣的细胞群中的细胞的完整细胞核)分配到多个分配区(例如,液滴或孔),使得至少一些分配区包含:(1)单个细胞(或单个细胞核),其包含模板基因组dna分子和模板rna分子(例如,mrna或核前mrna);(2)固体或半固体颗粒(例如珠粒,例如凝胶珠粒),其包含(i)如图29b(还参见图35a)所示的多个部分双链核酸条形码分子和(ii)如图35d所示的多个核酸条形码分子;(3)多个转座酶分子;(4)包含转座酶末端序列的多个核酸分子(例如,图29a);(5)包含聚-t序列的多个核酸分子;和(6)多个逆转录酶分子。在一些实施方案中,固体或半固体颗粒是珠粒。在一些实施方案中,珠粒是凝胶珠粒。在一些实施方案中,固体或半固体颗粒(例如,凝胶珠粒)包含图35a的附接于其中的多个部分双链核酸条形码分子和嵌入在固体或半固体颗粒(例如,凝胶珠粒)中的多个磁性颗粒(参见例如图34),其中多个磁性颗粒包括附接于其中的图35d的多个核酸条形码分子。在其他实施方案中,固体或半固体颗粒(例如,凝胶珠粒)包含图35d的附接于其中的多个核酸条形码分子和嵌入在固体或半固体颗粒(例如,凝胶珠粒)中的多个磁性颗粒,其中多个磁性颗粒包括附接于其中的图35a的多个核酸条形码分子。在一些实施方案中,图35a中的条形码序列和图35d中的条形码序列是相同的。在一些实施方案中,图35a中的条形码序列和图35d中的条形码序列包含相同的一个或多个条形码区段。在一些实施方案中,图35a中的条形码序列和图35d中的条形码序列是不同的。继续这些实施方案,在分配之后,将单个细胞(或细胞核)裂解,以便以基本上保持基因组dna的天然染色质组织的方式释放模板基因组dna和模板rna(例如细胞质mrna或细胞核mrna)。在某些实施方案中,将图35a和图35d的多个核酸条形码分子可释放地附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并且使分配区(例如,液滴或孔)经受各种条件,以引起条形码寡核苷酸分子从珠粒释放(例如,例如使用还原剂例如dtt解聚或降解珠粒)。然后使分配区经受各种条件,以生成如上述实施例所述的转座酶-核酸复合物。或者,在一些实施方案中,将多个预形成的转座酶-核酸复合物(例如图29a)分配到多个分配区(例如,液滴或孔)中。然后使分配区经受各种条件,使得转座酶-核酸复合物生成双链模板基因组dna片段。或者,在一些实施方案中,在分配的完整细胞核中大量进行转座反应,使得至少一些分配区包含(1)单个细胞(或单个细胞核),其包含模板基因组dna片段和模板rna分子;(2)固体或半固体颗粒(例如珠粒,例如凝胶珠粒),其包含(i)如图29b(还参见图35a)所示的多个部分双链核酸条形码分子和(ii)如图35d所示的多个核酸条形码分子;(3)包含聚-t序列的多个核酸分子;和(4)多个逆转录酶分子。在一些实施方案中,将图35a和图35d的核酸条形码分子附接于嵌入在如先前所述的固体或半固体颗粒(例如,凝胶珠粒)内的磁性颗粒。在分配之后,单个细胞核裂解以释放模板基因组dna片段和模板rna(例如,细胞质mrna或细胞核mrna)分子。继续此实施方案,在片段化后,大体通过将如图29b(还参见图35a)所示的部分双链核酸条形码分子连接至模板核酸片段来如图29d(或图29c,用于本体标签化)所概述处理模板基因组dna片段(参见例如实施例9和10)。处理模板rna分子(例如,mrna分子)以生成5'条形码化cdna分子。例如,使用逆转录酶处理包含聚-a尾的模板rna分子(例如,mrna)和包含聚-t序列的核酸分子,以生成cdna分子。在模板转换的实例中,在一些实施方案中,具有末端转移酶活性的酶(例如,具有末端转移酶活性的逆转录酶)以不依赖于模板的方式向cdna添加额外核苷酸(例如,聚c)。转换寡核苷酸或转换寡核苷酸序列可包含与额外核苷酸例如聚g互补的序列。cdna上的额外核苷酸(例如,聚c)与转换寡核苷酸上的额外核苷酸(例如,聚g)杂交,由此转换寡核苷酸可以被逆转录酶用作模板以进一步延伸cdna。因此,在一些实施方案中,逆转录酶包含末端转移酶活性,并使用图35d的多个核酸条形码分子中的转换寡核苷酸序列生成5'条形码化cdna片段。示例性方案3-使用线性扩增的scatac-seq+3'scrna-seq在某些条形码化方案中,将来自感兴趣的细胞群的细胞(或来自感兴趣的细胞群中的细胞的完整细胞核)分配到多个分配区(例如,液滴),使得至少一些分配区包含:(1)单个细胞(或单个细胞核),其包含模板基因组dna分子和模板rna分子(例如,mrna或核前mrna);(2)固体或半固体颗粒(例如珠粒,例如凝胶珠粒),其包含(i)如图35c所示的多个单链核酸条形码分子和(ii)如图35b所示的多个核酸条形码分子;(3)多个转座酶分子;(4)包含转座酶末端序列的多个核酸分子(例如,图29a);和(5)多个逆转录酶分子。在一些实施方案中,固体或半固体颗粒是珠粒。在一些实施方案中,珠粒是凝胶珠粒。在一些实施方案中,固体或半固体颗粒(例如,凝胶珠粒)包含图35c的附接于其中的多个单链核酸条形码分子和嵌入在固体或半固体颗粒(例如,凝胶珠粒)中的多个磁性颗粒(参见例如图34),其中多个磁性颗粒包括附接于其中的图35b的多个核酸条形码分子。在其他实施方案中,固体或半固体颗粒(例如,凝胶珠粒)包含图35b的附接于其中的多个核酸条形码分子和嵌入在固体或半固体颗粒(例如,凝胶珠粒)中的多个磁性颗粒,其中多个磁性颗粒包括附接于其中的图35c的多个核酸条形码分子。在一些实施方案中,图35c中的条形码序列和图35b中的条形码序列是相同的。在一些实施方案中,图35c中的条形码序列和图35b中的条形码序列包含相同的一个或多个条形码区段。在一些实施方案中,图35c中的条形码序列和图35b中的条形码序列是不同的。继续这些实施方案,在分配之后,将单个细胞(或细胞核)裂解,以便以基本上保持基因组dna的天然染色质组织的方式释放模板基因组dna和模板rna(例如细胞质mrna或细胞核mrna)。在某些实施方案中,将图35c和图35d的多个核酸条形码分子可释放地附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并且使分配区(例如,液滴或孔)经受各种条件,以引起条形码寡核苷酸分子从固体或半固体颗粒(例如珠粒)释放(例如,例如使用还原剂例如dtt解聚或降解珠粒)。然后使分配区(例如,液滴或孔)经受各种条件,以生成如上述实施例所述的转座酶-核酸复合物。或者,在一些实施方案中,将多个预形成的转座酶-核酸复合物(例如图29a)分配到多个分配区(例如,液滴或孔)中。然后使分配区经受各种条件,使得转座酶-核酸复合物生成双链模板基因组dna片段。或者,在一些实施方案中,在分配的完整细胞核中大量进行转座反应,使得至少一些分配区(例如,液滴或孔)包含(1)单个细胞(或单个细胞核),其包含模板基因组dna片段和模板rna分子;(2)固体或半固体颗粒(例如珠粒,例如凝胶珠粒),其包含(i)如图35c所示的多个单链核酸条形码分子和(ii)如图35d所示的多个核酸条形码分子;和(3)多个逆转录酶分子。在一些实施方案中,将图35c和图35d的核酸条形码分子附接于嵌入在如先前所述的固体或半固体颗粒(例如珠粒,例如凝胶珠粒)内的磁性颗粒。在分配之后,单个细胞核裂解以释放模板基因组dna片段和模板rna(例如,细胞质mrna或细胞核mrna)分子。继续此实施方案,在片段化后,大体通过使用图35c的核酸条形码分子对模板核酸片段进行线性扩增(在一些实施方案中,在扩增之前进行缺口填充)来如图31(或图30b,用于本体标签化)所概述处理模板基因组dna片段(参见例如实施例11和12)。使用逆转录酶,用图35b的多个核酸条形码分子处理包含聚-a尾的模板rna分子(例如,mrna分子),以生成如本文任何其他位置大体描述的条形码化cdna分子。示例性方案4-使用线性扩增的scatac-seq+5'scrna-seq在另一个条形码化方案中,将来自感兴趣的细胞群的细胞(或来自感兴趣的细胞群中的细胞的完整细胞核)分配到多个分配区(例如,液滴或孔),使得至少一些分配区包含:(1)单个细胞(或单个细胞核),其包含模板基因组dna分子和模板rna分子(例如,mrna或核前mrna);(2)固体或半固体颗粒(例如珠粒,例如凝胶珠粒),其包含(i)如图35c所示的多个单链核酸条形码分子和(ii)如图35d所示的多个核酸条形码分子;(3)多个转座酶分子;(4)包含转座酶末端序列的多个核酸分子(例如,图29a);(5)包含聚-t序列的多个核酸分子;和(6)多个逆转录酶分子。在一些实施方案中,固体或半固体颗粒是珠粒。在一些实施方案中,珠粒是凝胶珠粒。在一些实施方案中,固体或半固体颗粒(例如,凝胶珠粒)包含图35c的附接于其中的多个单链核酸条形码分子和嵌入在固体或半固体颗粒(例如,凝胶珠粒)中的多个磁性颗粒(参见例如图34),其中多个磁性颗粒包括附接于其中的图35d的多个核酸条形码分子。在其他实施方案中,固体或半固体颗粒(例如,凝胶珠粒)包含图35d的附接于其中的多个核酸条形码分子和嵌入在固体或半固体颗粒(例如,凝胶珠粒)中的多个磁性颗粒,其中多个磁性颗粒包括附接于其中的图35c的多个核酸条形码分子。在一些实施方案中,图35c中的条形码序列和图35d中的条形码序列是相同的。在一些实施方案中,图35c中的条形码序列和图35d中的条形码序列包含相同的一个或多个条形码区段。在一些实施方案中,图35c中的条形码序列和图35d中的条形码序列是不同的。继续这些实施方案,在分配之后,将单个细胞(或细胞核)裂解,以便以基本上保持基因组dna的天然染色质组织的方式释放模板基因组dna和模板rna(例如细胞质mrna或细胞核mrna)。在某些实施方案中,将图35c和图35d的多个核酸条形码分子可释放地附接于固体或半固体颗粒(例如珠粒,例如凝胶珠粒)并且使分配区(例如,液滴或孔)经受各种条件,以引起条形码寡核苷酸分子从固体或半固体颗粒(例如珠粒)释放(例如,例如使用还原剂例如dtt解聚或降解珠粒)。然后使分配区(例如,液滴或孔)经受各种条件,以生成如上述实施例所述的转座酶-核酸复合物。或者,在一些实施方案中,将多个预形成的转座酶-核酸复合物(例如图29a)分配到多个分配区(例如,液滴或孔)中。然后使分配区经受各种条件,使得转座酶-核酸复合物生成双链模板基因组dna片段。或者,在一些实施方案中,在分配的完整细胞核中大量进行转座反应,使得至少一些分配区包含(1)单个细胞(或单个细胞核),其包含模板基因组dna片段和模板rna分子;(2)固体或半固体颗粒(例如珠粒,例如凝胶珠粒),其包含(i)如图35c所示的多个单链核酸条形码分子和(ii)如图35d所示的多个核酸条形码分子;(3)包含聚-t的多个核酸分子;和(4)多个逆转录酶分子。在分配之后,单个细胞核裂解以释放模板基因组dna片段和模板rna(例如,细胞质mrna或细胞核mrna)分子。继续此实施方案,在片段化后,大体通过使用图35c的核酸条形码分子对模板核酸片段进行线性扩增(在一些实施方案中,在扩增之前进行缺口填充)来如图31(或图30b,用于本体标签化)所概述处理模板基因组dna片段(参见例如实施例11和12)。处理模板rna分子(例如,mrna分子)以生成如先前所述的5'条形码化cdna分子。例如,使用逆转录酶(例如,具有末端转移酶活性的逆转录酶)处理包含聚-a尾的模板rna分子(例如,mrna)和包含聚-t序列的核酸分子,以生成在5'端上包含额外核苷酸(例如,聚-c)的cdna分子。cdna上的额外核苷酸与转换寡核苷酸上的额外核苷酸(例如,聚-g)杂交,由此使用图35d的多个核苷酸条形码分子中的转换寡核苷酸序列进一步延伸cdna,以生成5'条形码化cdna分子。在上述实施方案中,在条形码化之后,然后从分配区(例如,液滴或孔)中释放条形码化衔接子侧接dna片段和条形码化cdna分子以提供释放的混合物并且大量处理以完成用于下一代高通量测序的文库制备(例如使片段或其衍生物经受一个或多个反应(例如核酸扩增),以添加功能序列,从而促进illumina测序)。在一些实施方案中,获取包含衔接子侧接dna片段和条形码化cdna的释放混合物的第一部分并且大量处理,以完成用于条形码化衔接子侧接dna片段的文库制备,同时获取释放混合物的第二部分并大量处理,以完成用于条形码化cdna分子的文库制备。在其他实施方案中,获取包含条形码化衔接子侧接dna片段和条形码化cdna分子的分配区(例如,液滴或孔)的第一部分并且大量处理,以完成用于条形码化衔接子侧接dna片段的文库制备,同时获取包含条形码化衔接子侧接dna片段和条形码化cdna分子的分配区(例如,液滴或孔)的第二部分并大量处理,以完成用于条形码化cdna分子的文库制备。在利用磁性颗粒(例如珠粒)的实施方案中,附接于其中的条形码化模板分子(例如条形码化模板dna片段或条形码化cdna分子或其衍生物)可以磁性分离并进一步处理以完成文库制备。然后根据合适的下一代测序方案(例如illumina测序)对一个或多个完全构建的文库进行测序。实施例18.r1序列修饰对条形码交换的作用将来自小鼠和人的细胞核标签化并且通过与三种类型的部分双链条形码之一连接(参见例如实施例9和图29a至图29c)来条形码化,将其混合,并随后使其经受检测,以便评定每个类型的条形码对区分不同类型的细胞核的能力的作用。三种类型的条形码包括具有标准r1序列的条形码(图37;顶部)、具有与标准r1序列相比缩短r1序列的条形码(图37;中间)和在r1序列中包含尿嘧啶的条形码(图37;底部)。与在具有标准r1序列的条形码中所见的不同细胞类型的分离相比,具有缩短的r1序列的条形码和具有尿嘧啶的条形码显示出小鼠和人细胞核的更大分离,这指示条形码交换率降低(图38a至图38c)。实施例19.使用阻断剂减少线粒体dna读长提供多个细胞,其中每个细胞包含模板核酸(例如细胞核dna,例如染色质)和非模板核酸(例如线粒体dna)。在细胞裂解剂和阻断剂(例如,牛血清白蛋白)存在下裂解多个细胞,以生成多个裂解的细胞。然后将多个核酸与多个裂解的细胞分离,以生成多个生物颗粒(例如,细胞核),其中多个生物颗粒中的给定生物颗粒包含非模板核酸分子(例如,线粒体dna分子)和模板核酸分子。模板核酸分子可以包含例如dna分子和rna分子。然后借助于包含转座酶核酸分子和转座子末端核酸分子的转座酶-核酸复合物,可以在多个生物颗粒中的生物颗粒中生成多个模板核酸片段。然后可以生成多个分配区,其中给定分配区包括(i)含有多个模板核酸片段和模板rna分子的单个生物颗粒和(ii)含有条形码序列的多个第一条形码寡核苷酸分子(例如,第一核酸条形码分子)。分配区可以还包含(iii)含有条形码序列和捕获序列的多个第二条形码寡核苷酸分子(例如,第二核酸分子);和(iv)多个逆转录酶分子。分配区可以是例如液滴或孔。然后可以使用多个第一条形码寡核苷酸分子中的条形码寡核苷酸分子和多个模板dna片段中的模板核酸片段在分配区内生成条形码化模板dna片段。如果存在模板rna分子,则可以使用多个第二条形码寡核苷酸分子中的条形码寡核苷酸分子通过逆转录由模板rna分子产生条形码化cdna分子。在一些情况下,生物颗粒可以是细胞核,其可以通过例如洗涤裂解细胞从裂解细胞中分离。在一些情况下,所述方法还包括产生测序读长。应用所述方法可以减少来源于非模板核酸分子(例如,线粒体dna分子)的测序读长相对于生成的测序读长的总数的分数。实施例20.减少分配区中的线粒体dna读长提供多个分配区(例如,液滴或孔)。所述多个分配区的给定分配区包含:(i)来自多个生物颗粒(例如,细胞)的单个生物颗粒(例如,细胞),其中所述单个生物颗粒包含模板核酸分子(例如细胞核dna分子,例如染色质)和非模板dna分子(例如,线粒体dna分子);(ii)包含条形码序列的多个条形码寡核苷酸分子(例如,核酸条形码分子);(iii)包含转座子末端序列的多个转座子末端寡核苷酸分子;和(iv)多个转座酶分子。给定分配区可以还包含逆转录酶和含有条形码序列和捕获序列的多个第二条形码寡核苷酸分子(例如,第二核酸条形码分子)。可以如前述实施例中所述生成条形码化模板核酸片段和条形码化非模板核酸片段。然后可以使用(i)靶向一个或多个非模板核酸片段的一个或多个指导核糖核酸分子(grna);和(ii)成簇规律间隔短回文序列(crispr)相关的(cas)核酸酶切割多个非模板dna片段或其衍生物中的一个或多个非模板核酸片段。在一些情况下,所述方法可以减少包含和/或来源于非模板核酸分子的片段和/或条形码化片段的量。例如,所述方法可以减少例如包含模板核酸片段、条形码化模板核酸片段、非模板核酸片段和条形码化非模板核酸片段中的一种或多种的混合物中非模板核酸片段和条形码化非模板核酸片段的总数。在一些情况下,内切核酸酶可以是cas9,例如重组cas9。在一些情况下,非模板核酸片段可包含线粒体dna或rna片段。在一些情况下,模板核酸片段可包含核dna片段。实施例21.线性扩增与连接方法的比较可以使用前述实施例中所述的任何方法生成样品文库。在一些情况下,可以使用线性扩增方法生成文库。在其他情况下,可以使用连接方法生成文库。线性扩增方法可以包括在分配区内生成模板核酸片段并在分配区内执行缺口填充延伸过程。然后可以使用例如耐热性聚合酶执行线性扩增。可以将条形码并入到包含模板核酸序列或其互补序列的序列中。然后可以将条形码化核酸片段从其各自的分配区释放到本体中以用于另外处理,包括例如pcr。连接方法可以包括在分配区内生成模板核酸片段并用连接酶例如t4dna连接酶将条形码连接到片段,从而生成条形码化核酸片段。然后可以将条形码化核酸片段从其各自的分配区释放到本体中以用于另外处理,包括例如缺口填充和额外序列添加。为了比较线性扩增与连接方法,根据本文描述的方法处理各种小鼠和人细胞。图40显示比较使用线性扩增或连接产生的不同重复样品文库(“a”和“b”)产生的测序度量的表。“a”重复表示在相同条件下,但使用不同的用户完成的反应,而“b”重复表示由相同用户在相同条件下完成的反应。图41a至图41b说明了检测的小鼠或人细胞的示例性量和从线性扩增atac-seq文库(使用75nm、150nm或250nm条形码引物)或基于连接的atac-seq文库(使用图37的条形码分子)的测序读长分析(图40)观察到的推断的双重速率。图41a说明了使用基于线性扩增或连接的atac-seq方法检测的小鼠或人细胞数量的差异。图41b说明了使用基于线性扩增或连接的atac-seq方法检测的推断的双重速率的差异。如图41b所示,线性扩增说明双重率高于连接。图42说明了通过每个细胞条形码的中值片段测量的从各种atac-seq文库获得的测序读长的灵敏度的比较。使用可编程微流体平台(fluidigm),将文库制备的线性扩增和连接方法的灵敏度(36k读长/细胞)与buenrostro等,nature,2015年7月23日;523(7561):486-90中描述的方法相比较。如图42所示,连接提供的灵敏度高于线性扩增。如图43所示,通过连接制备的对增加的深度(30m读长至800m读长)进行测序的文库说明相对于较低深度文库灵敏度显著增加(如通过每个细胞条形码的中值片段所测量的)且噪音降低(如通过非重复废弃读长的分数所测量的)。图48显示了从使用不同聚合酶制备的基于线性扩增的atac-seq文库以及通过连接制备的文库获得的示例性测序度量的比较:dna聚合酶、kapahifidna聚合酶(与甜菜碱组合)、dna聚合酶。“废弃”读长如图44所示,在执行本文描述的方法时,可以生成非重复“废弃”读长。图44说明了使用基于线性扩增或连接的atac-seq方法制备的文库中的总噪声(非重复的废弃读长(“非重复读长”)和基于线粒体的读长(“mito”))的示例性比较。图45a至图45b提供了通过不同文库制备方法产生的分解测序读长的示例性说明。图45a显示了由线性扩增atac-seq文库产生的读长的分解图。图45b显示了由基于连接的atac-seq文库产生的读长的分解图。如上所述,可以通过使用阻断剂例如牛血清白蛋白和/或通过使用cas9和靶向grna来除去可归因于线粒体核酸的读长。插入物尺寸分布还比较线性扩增和连接文库制备方法以检查插入物尺寸分布。图46a至图46b说明了读长对的示例性比较,其显示了由使用这些方案制备的atac-seq文库生成的核小体的周期性。通常在长度200bp以下观察到无核小体片段,指示核小体周期性为1的片段长度为约200bp,指示核小体周期性为2的片段长度为约400bp,指示核小体周期性为2的片段长度为约600bp等。本体富集如图47a至图47b所示,线性扩增显示由较短插入片段的偏置,转录起始位点(tss)的富集程度高于连接。对于ctcf(ccctc-结合因子)位点,也可能在线性扩增与连接方法之间观察到差异。实施例22.分析外周血单核细胞样品中的核酸使外周血单核细胞(pbmc)经受如本文所述的单个细胞rna-seq和atac-seq分析。图51a显示使用t分布随机近邻嵌入(t-distributedstochasticneighborembedding;tsne)产生的示例性散点图,允许可视化外周血单核细胞(pbmc)样品中不同亚群细胞类型的rna转录物。图51b显示使用t分布随机近邻嵌入(tsne)产生的示例性散点图,允许可视化外周血单核细胞(pbmc)样品中不同亚群细胞类型的atac-seq数据。实施例23.比较atac-seq方法图50说明了如本文所述的atac-seq分析的方案,并与来自以下的数据比较(1)典型的高质量传统本体atac-seq方案;(2)cusanovich等,science,2015年5月22日;348(6237):910-14;(3)buenrostro等,nature,2015年7月23日;523(7561):486-90;(4)来自atac-seq实验的理想测序度量;以及(5)使用本文所述方法获得的数据(“10x”)。尽管本文已示出和描述了本发明的优选实施方案,但对于本领域技术人员来说将显而易见,此类实施方案仅作为实例提供。本发明不旨在受到本说明书中提供的具体实施例限制。尽管已经参考上述说明书描述本发明,但本文中的实施方案的描述和说明不意图以限制意义解释。本领域技术人员现在将想到许多变化、改变和替换而不偏离本发明。此外,应当理解,本发明的所有方面均不限于本文所述的具体描述、配置或相对比例,其取决于多种条件和变量。应当理解的是,可以在实践本发明时采用在本文中描述的本发明的实施方案的各种替代方案。因此,预期本发明还应涵盖任何此类替代方案、修改、变型或等同物。所意图的是,以下权利要求限定本发明的范围以及由此涵盖这些权利要求及其等同物范围内的方法和结构。序列表<110>10x基因组学有限公司<120>转座酶可接近性染色质的单细胞分析<130>43487-770601<140>tbd<141>2018-05-25<150>62/511,905<151>2017-05-26<150>62/527,529<151>2017-06-30<150>62/650,223<151>2019-03-29<160>20<170>patentin3.5版<210>1<211>18<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>1agatgtgtataagagaca18<210>2<211>36<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>2tctacactctttccctacacgacgctcttccgatct36<210>3<211>33<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>3tcgtcggcagcgtcagatgtgtataagagacag33<210>4<211>23<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>4actacacgacgctcttccgatct23<210>5<211>34<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>5gtgactggagttcagacgtgtgctcttccgatct34<210>6<211>34<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>6gtctcgtgggctcggagatgtgtataagagacag34<210>7<211>18<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>7taatacgactcactatag18<210>8<211>67<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>modified_base<222>(37)..(48)<223>a、c、t、g、未知或其他<400>8tctacactctttccctacacgacgctcttccgatctnnnnnnnnnnnnagatgtgtataa60gagacag67<210>9<211>65<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>modified_base<222>(20)..(31)<223>a、c、t、g、未知或其他<400>9ctgtctcttatacacatctnnnnnnnnnnnnagatcggaagagcacacgtctgaactcca60gtcac65<210>10<211>87<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>modified_base<222>(57)..(68)<223>a、c、t、g、未知或其他<400>10aatgatacggcgaccaccgatctacactctttccctacacgacgctcttccgatctnnnn60nnnnnnnnagatgtgtataagagacag87<210>11<211>97<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>modified_base<222>(20)..(31)<223>a、c、t、g、未知或其他<220><221>modified_base<222>(66)..(73)<223>a、c、t、g、未知或其他<400>11ctgtctcttatacacatctnnnnnnnnnnnnagatcggaagagcacacgtctgaactcca60gtcacnnnnnnnnatctcgtatgccgtcttctgcttg97<210>12<211>48<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>modified_base<222>(37)..(48)<223>a、c、t、g、未知或其他<400>12tctacactctttccctacacgacgctcttccgatctnnnnnnnnnnnn48<210>13<211>46<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>modified_base<222>(1)..(12)<223>a、c、t、g、未知或其他<400>13nnnnnnnnnnnnagatcggaagagcacacgtctgaactccagtcac46<210>14<211>19<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>14agatgtgtataagagacag19<210>15<211>19<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<400>15ctgtctcttatacacatct19<210>16<211>68<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>modified_base<222>(57)..(68)<223>a、c、t、g、未知或其他<400>16aatgatacggcgaccaccgatctacactctttccctacacgacgctcttccgatctnnnn60nnnnnnnn68<210>17<211>78<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>modified_base<222>(1)..(12)<223>a、c、t、g、未知或其他<220><221>modified_base<222>(47)..(54)<223>a、c、t、g、未知或其他<400>17nnnnnnnnnnnnagatcggaagagcacacgtctgaactccagtcacnnnnnnnnatctcg60tatgccgtcttctgcttg78<210>18<211>97<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>modified_base<222>(20)..(31)<223>a、c、t、g、未知或其他<220><221>modified_base<222>(66)..(73)<223>a、c、t、g、未知或其他<400>18ctgtctcttatacacatctnnnnnnnnnnnnagatcggaagagcacacgtctgaactcca60gtcacnnnnnnnnatctcgtatgccgtcttctgcttg97<210>19<211>87<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>modified_base<222>(53)..(68)<223>a、c、t、g、未知或其他<400>19cgatgacgttaatacgactcactatagggactacacgacgctcttccgatctnnnnnnnn60nnnnnnnnagatgtgtataagagacag87<210>20<211>53<212>dna<213>人工序列<220><223>人工序列的描述:合成寡核苷酸<220><221>modified_base<222>(23)..(34)<223>a、c、t、g、未知或其他<400>20ctacacgacgctcttccgatctnnnnnnnnnnnnagatgtgtataagagacag53当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1