专利名称:用于核酸测序验证、校准和标准化的方法和系统的制作方法
技术领域:
本发明的教导涉及用于核酸测序仪器和数据的验证、校准和标准化的核酸序列控制。
背景技术:
在完成人类基因组计划后,测序产业的焦点已经转移至发现更高通量和/或更低成本的测序技术,有时称作下一代测序技术。在使测序更高通量和/或更低费用时,目的是,使该技术更易用于测序。这些目的可以通过使用测序平台和方法来达到,所述测序平台和方法提供更大量的非常复杂的样品的样品制备、测序更大数目的复杂样品和/或大量的信息产生和在短时间段内的分析。不同的方法(例如,通过合成测序、通过杂交测序和通过连接测序)正在发展,以满足这些挑战。在这些下一代测序技术中可能发生的缺点是,额外的系统噪音的产生或每一步的性能变动。在每一步中,该步骤的系统噪音或性能变动可能源自硬件、化学和软件中的至少一种。下一代测序技术和平台的复杂性可能需要多种控制,以确保在样品序列测定中样品制备的性能的一致性。因而,可能希望具有这样的控制或方法,其分离或鉴别系统噪音或每一步的变动(例如,差的)性能。噪音或变动的减少,可以改善随时间产生的数据集的标准化,假定产生的大量信息可以被有意义地对比。一种常规的控制使用从众所周知的样品(例如,大肠杆菌菌株)产生的片段文库, 并对片段文库进行测序方法。但是,天然存在的样品作为控制的应用,可以表现出自身的变动,这是由于样品的单个链内的突变。此外,这些常规的控制的制备,可以导致不同的序列被引入希望的控制序列的单克隆群体内,由此在控制系统自身内产生噪音。因此,在下一代测序领域内需要这样的控制系统和方法,其可以提供系统噪音和/ 或性能降低的不同来源的系统测定和表征。在序列测定中提供一致性的一个希望的方面包括,提供确保在运行之间(run-to-run)以及仪器之间(instrument-to-instrument)的仪器性能的控制。此外,可能希望提供这样的控制技术,其使在测序过程中由化学和/或文库构建引起的性能变动和/或噪音的检测的可能性最小化,由此允许这样的检测归因于仪器质量。
图1描述的方框图表示用于下一代测序的仪器的不同实施方案;图2示意性描述了根据本发明的教导可用于核酸测序的验证、校准和标准化的合成控制珠子的一个示例性实施方案;图3示意性描述了根据本发明的教导的合成控制珠子的另一个示例性实施方案;图4A-4D显示的一系列图描绘了根据本发明的教导用于制备合成控制珠子的不同实施方案的方法的可控制性质;图5的图显示了根据本发明的教导的示例性实施方案而制备的不同合成控制珠子的模板密度结果;图6的图描绘了制备合成控制珠子的不同实施方案的方法的一个示例性实施方案的再现性;图7是在用于测序的仪器上使用合成控制珠子产生的错误图;图8A-8B显示的2幅图证实了根据本发明的教导的不同示例性实施方案,与使用合成控制珠子产生的原有系统噪音相比,用于测序的仪器的系统噪音促成;且图9是satay图,其显示了合成控制珠子集合的质量控制OlC)测序中的4种染料的强度,所述合成控制珠子包含相同数目的各自IOM个核酸序列。应当理解,附图不是按比例绘制,附图中的物体也不一定按照彼此的关系的比例绘制。描绘的图意在澄清和理解本文公开的仪器、系统和方法的不同实施方案。在可能时, 贯穿所有附图使用相同的索引编号表示相同或类似的部件。
具体实施例方式本文使用的部分标题仅用于组织目的,不应解释为以任何方式限制描述的主题。 在本申请中引用的所有文献和类似的材料,包括但不限于专利专利申请、文章、书、论文和因特网页,都特别地为任意目的通过引用整体并入。当在并入的参考文献中的术语的定义显得不同于在本发明的教导中提供的定义时,以在本发明的教导中提供的定义为准。应当理解,在本发明的教导中所讨论的温度、浓度、次数等之前隐含“约”,使得轻微且非实质的偏差在本发明的教导的范围内。在本申请中,单数的使用包括复数,除非另有特别说明。另外,“包含”、“含有”、“包括”的使用不表示限制性的。应当理解,前面的一般描述和下面的详细描述仅仅是示例性的和解释性的,不是限制本发明的教导。除非另有定义,与本文所述的本发明的教导结合使用的科学和技术术语应当具有本领域普通技术人员通常理解的含义。此外,除非上下文另有要求,单数术语应当包括复数,复数术语应当包括单数。通常,与本文所述的细胞和组织培养、分子生物学、和蛋白、和寡核苷酸或多核苷酸化学和杂交中使用的命名法和技术,是本领域众所周知的且常用的那些。使用标准技术,例如,用于核酸纯化和制备、化学分析、重组核酸和寡核苷酸合成。根据生产商的说明书或按照本领域通常实现的或如本文所述,进行酶反应和纯化技术。通常根据本领域众所周知的常规方法,并按照在本说明书中引用和讨论的不同的一般的和更具体的参考文献所述,进行本文所述的技术和操作。参见,例如,Sambrook等人,Molecular Cloning :A Laboratory Manual (第 3 版,Cold Spring Harbor Laboratory Press, Cold Spring Harbor,N. Y. 2000)。使用的命名法和本文所述的实验操作和技术,是本领域众所周知且常用的那些。如根据本文提供的实施方案所使用的,除非另有说明,下面的术语应当理解为具有下述含义
短语“下一代测序”表示基于非Sanger的测序技术,其具有增加的通量,例如具有一次产生数十万相对小的序列读数的能力。下一代测序技术的一些实例包括、但不限于通过合成测序、通过连接测序和通过杂交测序。一些相对众所周知的下一代测序方法另外包括由454 Corporation开发的焦磷酸测序、Solexa系统和由Applied Biosystems (现在的 Life Technologies, Inc.)开发的SOLiD (通过寡核苷酸连接和检测的测序)。短语“合成珠子”或“合成控制珠子”表示这样的珠子,其具有连接到珠子上的合成模板核酸序列的多个拷贝。可以使用连接序列来将合成模板连接到珠子上。短语“片段文库”表示通过将较大的核酸切割或剪切成较小的片段而产生的核酸片段的集合。片段文库可以从天然存在的核酸(诸如细菌核酸)产生。也可以产生包含类似大小的合成核酸序列的文库,以产生合成片段文库。短语“配对文库”表示如下产生的核酸序列的集合通过用内部接头构建体循环核酸片段,然后取出核酸片段的中间部分,以产生包含内部接头的线性核酸链,其中来自核酸片段的末端的序列连接到内部接头的任一端。象片段文库一样,配对文库可以从天然存在的核酸序列产生。通过将合成核酸序列连接到内部接头序列的任一端,也可以产生合成的配对文库。短语“合成核酸序列”及其变体表示设计的和合成的核酸序列。例如,按照规则或指南,可以设计合成核酸序列。例如,可以设计一组合成核酸序列,使得每个合成核酸序列包含不同的序列,和/或一组合成核酸序列包含设定长度的序列的每个可能的变体。例如, 一组64个合成核酸序列可以包含3碱基序列的每个可能的组合,或一组IOM个合成核酸序列可以包含5碱基序列的每个可能的组合。短语“控制集合”表示各自具有已知序列的核酸的集合,其中存在多个不同的核酸序列。控制集合可以包含,例如,具有与其相连的核酸序列的珠子。核酸序列的来源可以是合成地衍生的核酸序列或天然存在的核酸序列。天然存在的或合成的核酸序列可以提供为,例如,片段文库或配对文库或类似的合成文库。所述核酸序列也可以是其它形式,诸如包含多个插入物和多个内部接头的模板。其它形式的核酸序列可以包括连环体 (concatenate)0术语“模板”表示连接到固体支持物(诸如珠子)上的核酸序列。例如,模板序列可以包含连接到固体支持物上的合成核酸序列。模板序列也可以包括来自目标样品的未知核酸序列和/或已知核酸序列。短语“模板密度”表示连接到每个单个固体支持物上的模板序列的数目。短语“satay图”表示4_空间图在2_ 二维平面上的投影。例如,satay图可以描绘4种不同的染料在2- 二维平面中的强度。本发明的教导涉及在执行核酸测序中用于进行质量控制的方法和系统的不同示例性实施方案。例如,本发明的教导预见到合成控制珠子,其可以用作在测序中使用的仪器和化学(例如,探针化学)的验证、校准和/或标准化的控制。本发明的教导另外涉及用于验证、校准和/或标准化在测序中使用的仪器的方法和系统。本发明的教导的不同实施方案涉及用于进行核酸样品测序的质量控制的系统。所述系统可以包括固体支持物的集合,每个固体支持物具有与其相连的多个核酸序列。所述集合可以包括多组固体支持物,且每个组可以含有具有与其相连的相同核酸序列的固体支持物,其中每个组的核酸序列彼此不同,且其中所述核酸序列被合成地衍生。本发明的教导的其它示例性实施方案涉及为进行核酸样品测序准备质量控制的方法,所述方法包括产生多个合成核酸序列,其中每个合成核酸序列不同于其它核酸序列,将该合成核酸序列中的每一个连接到在多组固体支持物中的固体支持物上,其中每个组中的固体支持物具有与其相连的相同的合成核酸序列,并将每个组的固体支持物与连接的合成核酸序列相组合,以产生用于进行核酸样品测序的固体支持物的控制集合。本发明的教导的其它实施方案进一步涉及进行核酸测序验证的方法,所述方法包括将固体支持物的集合放置在核酸测序仪器的检测区域,所述每个固体支持物具有多个与其相连的合成核酸序列,其中所述固体支持物的集合包含多组固体支持物,组中的每个固体支持物具有与其相连的相同的合成核酸序列,且不同组中的固体支持物具有与其相连的不同的合成核酸序列。所述方法可以另外包括产生焦点地图(focal map),以鉴别每个固体支持物相对于核酸测序仪器的检测区域的位置,并进行一个或多个连接循环,以将染料-标记的探针序列连接到与固体支持物相连的核酸序列上。所述方法可以另外包括检测连接到每个核酸序列上的染料-标记的探针,测量染料-标记的探针的强度,并将测量的强度与阈值对比,以确定仪器是否有效工作。在本文所述的不同实施例和实施方案中,使用双碱基或二碱基编码(例如,如在 SOLiD测序中所采用的),针对通过连接测序的系统描述了合成的控制系统和方法。但是, 本领域技术人员会容易地明白,本文所述的合成珠子和方法可以适用于其它测序系统或检测技术。使用合成珠子的合成控制珠子和方法的原理可以适用于其它系统和方法,而不脱离本文所述的本发明的教导的范围。用于下一代测序的平台的不同实施方案可以包括在图1的方框图中显示的组分。 根据不同的实施方案,仪器100可以包括流体递送和控制单元110、样品处理单元120、光学单元130和数据获取、分析和控制单元140,在美国专利申请
发明者C·格耶斯塔, D·P·格雷纳, H·布罗伊, J·S·齐格尔, J·钱, L·W·琼斯, M-Y·沈 申请人:生命科技公司