检测染色体异常的方法_2

文档序号：9252013阅读：来源：国知局

的核酸总数的比例；其中相对于正常怀孕中的比例，所测比例中的统计显著差异，表明靶染色体中的胎儿异常。
[0018] 依照本发明的第二方面，提供在怀孕的女性受试者中预测胎儿性别的方法，所述方法包括以下步骤： (a) 自所述怀孕的女性受试者中获得生物样品； (b) 获得在所述生物样品内的核酸分子的序列数据； (c) 在所述序列数据内的每个核酸序列和对应于参考基因组的独特部分的序列之间进行匹配分析，使得每个匹配的核酸被指定到所述参考基因组内的特定染色体或所述染色体的一部分，其中所述匹配分析对于对应于所述参考基因组中的碱基的每个核酸内的每个碱基产生准确率分值并对于任何插入、缺失、模糊和/或取代产生罚分，使得如果每个核酸的总分值达到预定分值阈值，匹配被指定；和 (d) 测定指定到Y染色体的匹配的核酸总数相对于指定到一个或多个参考染色体的每个的匹配的核酸总数的比例；其中高于预定比例的匹配的Y染色体序列的存在表明存在男性胎儿，而低于预定比例的匹配的Y染色体序列的存在表明存在女性胎儿。
[0019]附图简述图1:Prinseq序列重复概括统计学。
[0020] 在产生简明概括统计学和重要地是还在产生在样品中普遍的重复序列数量中使用Prinseq的范例，其原始数据显示在下表中：
图2:依照本发明的方法分析27个血浆样品。图2显示来自正常怀孕的血浆样品（样品1-15)和来自三体性21怀孕的血浆样品（样品16-27)的Z分值。
[0021] 发明详述依照本发明的第一方面，提供在得自女性受试者的生物样品中检测胎儿染色体异常的方法，所述方法包括以下步骤： (a) 获得在所述生物样品内的核酸分子的序列数据； (b) 在所述序列数据内的每个核酸序列和对应于参考基因组的独特部分的序列之间进行匹配分析，使得每个匹配的核酸被指定到所述参考基因组内的特定染色体或所述染色体的一部分，其中所述匹配分析对于对应于所述参考基因组中的碱基的每个核酸内的每个碱基产生准确率分值并对于任何插入、缺失、模糊和/或取代产生罚分，使得如果每个核酸的总分值达到预定分值阈值，匹配被指定；和 (c) 测定指定到靶染色体的匹配的核酸总数相对于指定到一个或多个参考染色体的每个的匹配的核酸总数的比例；其中相对于正常怀孕中的比例，所测比例中的统计显著差异表明靶染色体中的胎儿异常。
[0022] 本发明指定合适的生物信息学处理，其尤其容忍非常频繁的取代和indel误差和误操作的短均聚物运行。该生物信息学处理允许以合适有效方式将序列可靠地指定到染色体，即结合可靠性而不抛弃实际上不可行的、大的、序列数据部分作为不可匹配到任何染色体，或将其错误指定到不准确的染色体位置。
[0023] 染色体异常本发明用于检测的合适的染色体异常的实例包括：唐氏综合征（三体性21)、Edward's综合征（三体性18)、Patau综合征（三体性13)、三体性9、Warkany综合征（三体性8)、 CatEye综合征（4拷贝的染色体22)、三体性22和三体性16。
[0024]另外，或或者，在基因、染色体或染色体部分、拷贝数的异常性检测可包括选自以下病况的检测和/或诊断：Wolf_Hirschhorn综合征（4p_)、Criduchat综合征（5p_)、 Wi11iams-Beuren综合征（7_)、Jacobsen综合征（11-)、Miller-Dieker综合征（17_)、 Smith-Magenis综合征（17_)、22ql1.2 缺失综合征（也称为Velocardiofacial综合征、 DiGeorge综合征、椎体畸形脸（conotruncalanomalyface)综合征、先天性胸腺发育不全和Strong综合征）、Angelman综合征（15-)和Prader-Willi综合征（15-)。
[0025]另外，或或者，染色体拷贝数的异常性检测可包括选自以下的病况的检测和/或诊断：Turner综合征（Ullrich-Turner综合征或单体性X)、Klinefelter's综合征、47,XXY或XXY综合征、48,XXYY综合征、49,XXXXY综合征、三联体X综合征、XXXX综合征（也称为四体性X、四倍X、或48,XXXX)、XXXXX综合征（也称为五体性X或49,XXXXX)和XYY综合征。
[0026] 在一个实施方案中，所述靶染色体是染色体13、染色体18、染色体21、X染色体或 Y染色体。
[0027] 在一个实施方案中，所述胎儿染色体异常是胎儿染色体非整倍性。在又一实施方案中，所述胎儿染色体非整倍性是三体性13、三体性18或三体性21。在还一个实施方案中，所述胎儿染色体非整倍性是三体性21 (唐氏综合征）。在该实施方案中，本领域技术人员将容易理解，本发明的方法学可用于诊断胎儿携带染色体21的大部分、而非完整染色体的情况。
[0028] 样品提取可以理解，样品可以依照常规程序得自怀孕的女性受试者。在一个实施方案中，所述生物样品是母体血液、血浆、血清、尿或唾液。在进一步的实施方案中，所述生物样品是母体血浆。
[0029] 获得母体血浆的步骤典型地包括自怀孕的女性受试者抽取（典型地通过静脉穿刺）5-20ml血液样品（典型地外周血样品）。因此，获得这样的样品的特征是对胎儿空间是非侵入性的，并且对于母亲是最小侵入性的。在通过离心去除细胞材料后，通过常规方法制备血浆（Maron等人，2007，MethodsMolMed132，51-63)〇
[0030] 通过常规方法自母体血浆提取DNA，该法对于血浆DNA的核苷酸序列而言是无偏倚的（Maron等人，2007，出处同上）。血浆DNA分子群体典型地包含胎儿来源部分和母体来源部分。
[0031] 获得序列数据通常获得和制备足够量的血浆DNA分子（至少500, 000和典型地数百万分子）的DNA序列数据（Fan和Quake, 2010，PLoSOne5)，用于生物信息学分析。对于待检测的异常性类型，经统计学方法测定足够量。生物信息学分析经特别设计，以容忍indel和错配误差，同时以与特定染色体的独特序列可靠匹配的形式有效地提取所需信息。
[0032] 技术人员将理解，本发明不限于用于获得序列数据的任何具体技术。然而，可以理解，当序列数据的质量次于常规基因组测序通常观察到的那样时，本发明的方法找到更大用途。例如，在一个实施方案中，所述序列数据通过包括使用聚合酶链式反应的测序平台而获得。在又一实施方案中，所述序列数据使用下一代测序平台而获得。这样的测序平台已经在以下文献中有广泛讨论和综述：Loman等人（2012)NatureBiotechnology 30(5)，434-439;Quail等人（2012)BMCGenomics13，341;Liu等人（2012)Journal ofBiomedicineandBiotechnology2012, 1-11 ;和Meldrum等人（2011)ClinBiochem Rev. 32(4): 177 - 195;其测序平台通过引用结合到本文中。
[0033] 合适的下一代测序平台的实例包括：Roche454 (即Roche454GSFLX)、Applied Biosystems'SOLiD系统（即S0LiDv4)、Illumina'sGAIIx、HiSeq2000 和MiSeq测序仪、 LifeTechnologies'IonTorrent基于半导体的测序仪、PacificBiosciences'PacBio RS和Sanger's3730xl〇
[0034] 每个Roche's454平台使用焦磷酸测序，藉此化学发光信号表明碱基掺入并且通过均聚物阅读，信号强度关系到掺入的碱基数量。
[0035] 在一个实施方案中，序列数据得自测序平台，其包括使用基于半导体的测序方法学。基于半导体的测序方法学的优点是，仪器、芯片和试剂的制造非常廉价，测序过程快速 (尽管被emPCR偏置）并且系统可扩展，尽管这可能会略微受到用于emPCR的珠的大小的限制。
[0036] 在一个实施方案中，序列数据是通过测序平台而获得，其包括使用通过合成的测序（sequencing-by-synthesis)。Illumina's通过合成的测序（SBS)技术是目前成功的和在全世界被广泛接受的下一代测序平台。TruSeq技术支持大规模平行测序，使用具有专利权的基于可逆终止子的方法，当单个碱基掺入生长中的DNA链时，所述方法能够检测它们。当加入每个dNTP并随后切割以允许掺入下一个碱基时，荧光标记的终止子被成像。因为所有4种可逆终止子结合的dNTP在每个测序周期中都存在，所以天然竞争使得掺入偏倚最小化。
[0037] 在一个实施方案中，序列数据得自包括使用基于纳米孔的测序方法学的测序平台。在又一实施方案中，所述基于纳米孔的方法学包括使用有机型纳米孔，其模拟活细胞中的细胞膜和蛋白通道的环境，例如在OxfordNanoporeTechnologies所用的技术中（例如 BrantonD,BayleyH,等人（2008).NatureBiotechnology2

完整全部详细技术资料下载

当前第2页1 2 3 4 5