用于宏基因组生物标志检测的组合物和方法与流程

文档序号:11141505阅读:866来源:国知局
该申请要求2014年4月11日提交的美国申请号61/978,333的优先权和益处,其以其全部通过引用被并入本文。发明背景近年来鉴定致病生物——包括病毒、细菌、真菌、蠕虫、和原生动物——的需要已变得更加急迫。与疾病联系的病原体的鉴定相关的复杂性是使人畏缩的,并且检测这些因子的能力对医学、兽医和农科科学具有极度重要性。感染性疾病的临床处理中的重要因素在于形成感染的病原体的鉴定的确立。在大多数情况下,感染微生物的鉴定对于针对适当治疗和照料做出决定是重要的。从这一点上,主治医师必然依赖临床微生物学实验室来提供需要的基本信息以开始合理的治疗计划。临床情况中关于检测病原体的挑战包括直接从临床样本或样品进行测定的需要、检测需要的时间、可能不能培养传染因子、关于罕见或未知传染因子检测的困难、和与在呈现相似症状的传染因子中鉴定传染因子相关的困难。在另一个实例中,由于食物链中连续的病原体暴露,保持食品安全中的相当大的挑战(Scallanet.al.,“FoodborneillnessacquiredintheUnitedStates-majorpathogens.”EmergInfectDis.2011;17(1):7-15)。在美国每年报道有4800万例食物传染疾病。导致大约128,000人住院和3,000人死亡。经济和健康护理冲击显著,估计有$1520亿。食品安全测试对于鉴定和去除已被病原体暴露污染的食品来源已变得重要。食品安全测试的市场2011年是$33亿,并计划到2017继续经历令人注目的增长。动物和植物中与疾病联系的大量病原体是广泛的,目前的筛选测定不能在单个测定中针对大量病原体进行快速和同时筛选。由于新形成的编目扩大了人微生物群系(microbiome)中的种类计数和表征它们的分布,所以需要宏基因组(metagenomic)工具来有效地鉴定与疾病强烈相关的因子。评价微生物群系的能力将是必需的以了解病原体之间的相互作用、和病原体与共生的生物的相互作用、宿主遗传学、和环境因素。在2008年,全世界超过200万癌症病例(所有肿瘤的20%)与十种传染因子之一相关:七种病毒(乳头瘤病毒、乙型或丙型肝炎、EB病毒、人疱疹病毒8、和T细胞白血病病毒1型)、一种细菌(幽门螺杆菌(Helicobacterpylori))和两种蠕虫(血吸虫和肝吸虫),其作为病原体是癌症的主要贡献者(deMarteletal.LancetOncol2012;13(6):607-615)。考虑到包括正常的人微生物群系的数千种类,(Relman.Nature2012;486(7402):194-195),可能微生物群体实质地影响正常生理学以及疾病的原因和应答(Laassetal.AutoimmunRev2014),疾病包括癌症。这些效应是已知具有居住的微生物群系的组织如胃肠道(Laassetal.AutoimmunRev2014;MajorandSpiller.CurrOpinEndocrinolDiabetesObes2014;21(1):15-21;Schwarzbergetal.PLoSOne2014;9(1):e86708;ScharschmidtandFischbach.DrugDiscovTodayDisMech2013;10(3-4))、皮肤(ScharschmidtandFischbach.DrugDiscovTodayDisMech2013;10(3-4))和气道(Martinezetal.AnnAmThoracSoc2013;10Suppl:S170-179;Segaletal.AnnAmThoracSoc2014;11(1):108-116;Szeetal.HAnnAmThoracSoc2014;11Suppl1:S77)中和免疫和炎症应答(Gjymishkaetal.Irnmunotherapy2013;5(12):1357-1366;KamadaandNunez.Gastroenterology2014;Kobozievetal.FreeRadicBiolMed2013;68C:122-133;Ooietal.PLoSOne2014;9(1):e86366)中大量研究的主题。微生物群系概况分析也正在揭露微生物的较不明显的作用和它们在料想不到的位置的存在;与癌症有关的实例包括肿瘤微环境的调节(Iidaetal.Science2013;342(6161):967-970)和乳腺癌组织中细菌群体的生态失调(Xnanetal.PLoSOne2014;9(1):e83744)。现有的检测与疾病相关的病原体的策略需要样品获自被感染的对象,且许多技术用于鉴定病原体(参见,例如,图1A和1B)。这些技术通常包括酶联免疫吸附试验(ELISA)、针对可疑病原体的特定蛋白的特异性抗体、实验室中病原体的体外培养、和PCR扩增策略。使用通用的16S核糖体RNA引物的PCR扩增,之后是扩增子测序,是最广泛使用的微生物群系研究的策略和提供有效的发现工具(Coxetal.HumMolGenet2013;22(R1):R88-94),但是只针对具有逃过种群PCR的扩增子的细菌种类,而不针对病毒或真核微生物。16SrRNA测序也可用于筛选大量样品,但是不可在菌株之间区分或报告基因组变异体或致病性因子的存在。来自样品的总DNA的深度测序可鉴定细菌、病毒和其它微生物群系成员(The人MicrobiomeProjectConsortium.Nature2012;486(7402):207-214;Coxetal.HumMolGenet2013;22(R1):R88-94;Maetal.JVirol2014),但是效率严重受损。甚至以迄今未实现的每个基因组$1000的目标,总DNA测序也是筛选成百上千的测试和对照样品以检测病原体与疾病关联的昂贵方法。取决于抽样的样本,数据可压倒性地来自宿主人序列,产生不必要的大的定位病原体标记的搜索空间和导致被丢弃的多数序列阅读。DNA微阵列已用于宏基因组学。LawrenceBerkeleyLab/AffymetrixPhyloChip是基于核糖体RNA序列(Brodieetal.ApplEnvironMicrobiol2006;72(9):6288-6298)。学术上发展的Virochip具有针对1500种病毒的探针(Chenetal.JVisExp2011(50))和已成功检测了病理学样品中的病毒。Virochip平台受限于病毒和分析反转录成cDNA用于PCR扩增的RNA(Chenetal.JVisExp2011(50))。GlomicsGeoChip4.0集中于人微生物群系中细菌进行的RNA表达(Tuetal.MolEcolResour2014),且涵盖噬菌体,但是没有其它病毒或任何真核微生物。PathGenDx已首创了PathChipKit,其描写了针对所有已知病毒和宽的细菌选择(Wongetal.GenomeBiol2007;8(5):R93),但是没有真核病原体的Affymetrix微阵列的特征。这些和其它基于阵列的工具显示对宽的微生物容量——包括超过细菌的物种——的快速和经济地筛选大量样品的方法的需求(Normanetal..Gastroenterology2014)。因为当前的检测和鉴定致病和病原体的方法不充足,所以迫切需要快速和同时检测和鉴定多个病原体——包括所有当前已知的病原体——的组合物和方法。这样的组合物和方法也用于病原体相关疾病——包括感染性疾病和癌症——的诊断和用于获得由多个病原体引起的共感染产生的疾病状态的了解。本发明实现了这些需要。发明概述如本文所述,本发明描写了用于包括来自多种来源和/或生物(例如,宏基因组、微生物群系)的遗传物质的样品中一种或多种生物标志检测的组合物和方法的特征。特别地,申请人已发展了产生用于来自多个致病生物和因子(例如病毒)的遗传物质的检测的多组核苷酸的方法,以及制备用于分析的包括总核酸提取物(例如,DNA和RNA)的样品的方法。在某些实施方式中,本发明描写用于同时检测和鉴定存在于样品中的包括病毒,细菌,真菌,原生动物和蠕虫的多个类型病原体的核苷酸阵列和方法的特征。另外,基于迄今未知的病原体中保守的核酸序列的区域的存在,本发明的阵列和方法可用于检测存在于样品中的迄今未知的病原体。在一个实施方式中,病原体的核酸来自获自疑似或已知受病原体.感染的个体的样品。传染因子的检测可用于指导患者护理和治疗选择(例如,抗微生物、抗病毒、抗真菌、抗细菌、或抗寄生虫治疗)。本文公开的阵列和方法可用于通过比较样品中病原体的核酸序列与相关组的病原体中共有的序列区域的特性针对已知和迄今未知的病原体的存在来快速筛选样品。结合下面提供的实例,本发明限定的组合物和物品被分离或另外被制造。根据详细描述和根据权利要求,本发明的其它特点和优势将是明显的。定义除非另外限定,本文使用的所有技术和科学术语具有本发明所属领域的技术人员所通常理解的意思。以下参考文献提供给技术人员用于该发明的许多术语的一般定义:Singletonetal.,DictionaryofMicrobiologyandMolecularBiology(2nded.1994);TheCambridgeDictionaryofScienceandTechnology(Walkered.,1988);TheGlossaryofGenetics,5thEd.,R.Riegeretal.(eds.),SpringerVerlag(1991);andHale&Marham,TheHarperCollinsDictionaryofBiology(1991)。如本文所用,以下术语具有下面归于它们的意思,除非另外说明。如本文所用,冠词“一(a)”和“一(an)”于指一个或超过一个(即,至少一个冠词的语法对象。通过实例,“一元件”指一个元件或超过一个元件。如本文所用当提到可测量的值如数量、持续时间等时,术语“约”意味着包括指定值的±20%的变化或在指定值的10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.1%、0.05%、或0.01%内,因为这样的变化对进行公开的方法是适当的。除非另外根据上下文是清楚的,本文提供的所有数值都由术语约修饰。如本文所用的“生物标志”或“标志”通常指核酸分子、临床指示物、蛋白质、或与极性相关的其它分析物。在某些实施方式中,核酸生物标志指示样品中病原性生物——包括但不限于病毒、类病毒、细菌、真菌、蠕虫、和原生动物——的存在。在多种实施方式中,相对于参照,标志区别地存在于获自患有或濒临发展疾病(例如,传染病)的对象的生物样品中。如果存在于样品中的生物标志的平均水平或中间水平在统计学上区别于参照中存在的水平,那么标志区别地存在。参考水平可以是,例如,存在于获自清洁或未污染的来源的环境样品中的水平。参考水平可以是,例如,存在于样品获自健康对照对象中的水平或获自更早的时间点,即,治疗之前的对象的水平。统计学显著性的通常检验包括t-检验、ANOVA、Kruskal-Wallis、Wilcoxon、Mann-Whitney和比值比。生物标志,单独或组合,提供对象属于感兴趣的表型状态的相对可能性的测量。对象样品中本发明的标志的差别存在可用于表征对象为患有或濒临发展疾病(例如,传染病),用于确定对象的预后,用于评价治疗效果,或用于选择治疗方案。“剂”指任何核酸分子、小分子化合物、抗体或多肽或其片段。“变化”指增加或减少。变化可以超过与1%、2%、3%、4%、5%、10%、20%、30%一样少或超过40%、50%、60%,或甚至超过与70%、75%、80%、90%或100%一样多。″生物样品″指任何来自生物的组织、细胞、液体或其它材料。″捕获试剂″指特异地结合核酸分子或多肽以选择或分离核酸分子或多肽的试剂。如本文所用,术语“测定(determining)”、“评定”、“测定(assaying)”、“测量”和“检测”指定量和定性测定,并且像这样,术语“测定(determining)”在本文与“测定(assaying)”、“测量”等可互换地使用。意欲定量测定时,使用短语“测定分析物和类似物的量”。意欲定性和/或定量测定时,使用短语“测定分析物的水平”或“检测”分析物。″可检测的部分″指这样的组合物,其当与感兴趣的分子连接时引起后者通过分光镜、光化学、生物化学、免疫化学或化学手段可检测。例如,有用的标记包括放射性同位素、磁珠、金属珠、胶粒、荧光染料、电子致密试剂、酶(例如,如ELISA中所通常使用的)、生物素、地高辛配基或半抗原。″片段″指核酸分子的部分。该部分含有,优选,参考核酸分子或多肽的全长的至少10%、20%、30%、40%、50%、60%、70%、80%或90%。片段可含有5、10、15、20、30、40、50、60、70、80、90或100个核苷酸。″杂交″指氢键合,其可以是互补的核酸碱基(nucleobase)之间的Watson-Crick、Hoogsteen或反向的Hoogsteen氢键合。例如,腺嘌呤和胸腺嘧啶是通过氢键的形成而配对的互补的核酸碱基。术语″分离的″、″纯化的″或″生物学纯的″指如以其天然状态所发现的以不同的程度从正常地伴随其的组分释放出来的材料。″分离″表示从最初的来源或环境分离的程度。″纯化″表示较分离更高的分离的程度。″纯化的″或″生物学纯的″蛋白质完全没有其它材料以至于任何杂质都没有实质上影响蛋白质的生物学性质或引起不利后果。即,如果当通过重组DNA技术产生时基本上没有微孔材料、病毒材料或培养基,当以化学方法合成时基本上没有化学前体或其它化学药品,则本发明的核酸或肽被纯化。纯度和同质性通常使用分析化学技术,例如,聚丙烯酰胺凝胶电泳或高效液相色谱法来测定。术语″纯化的″可表示核酸或蛋白质在电泳凝胶中产生基本上一条带。对于可经历修饰,例如,磷酸化或糖基化的蛋白质,不同的修饰可产生不同的分离的蛋白质,其可被单独纯化。″参考″指比较的标准。如对本领域技术人员明显的是,适当的参考是其中一个成分被改变以测定该成分的作用。在一个实施方式中,可比较存在于样品中的靶核酸分子的水平与存在于清洁或无污染的样品中的靶核酸分子的水平。例如,可比较存在于样品中的靶核酸分子的水平与存在于相应的健康细胞或组织中或存在于患病细胞或组织(例如,来自具有疾病、病症或状况的对象的细胞或组织)中的靶核酸分子的水平。″标志概况″指两个或多个标志(例如,聚核苷酸)的信号、水平、表达或表达水平的表征。如本文所用,术语″核酸″指脱氧核糖核苷酸、核糖核苷酸或修饰的核苷酸,和以单链或双链形式的其聚合物。该术语包括含有已知核苷酸类似物或修改的主链残基或连接的核酸,其是合成的、天然存在的和非天然存在的。用于本发明的方法的核酸分子包括特异地结合靶核酸(例如,核酸生物标志)的任何核酸分子。这样的核酸分子不必与内源性核酸序列100%相同,但是将通常显示实质的同一性。具有与内源性序列″实质的同一性″的聚核苷酸通常能与双链核酸分子的至少一条链杂交。″杂交″指在多种严格条件下在互补的聚核苷酸序列(例如,本文描述的基因)或其部分之间配对以形成双链分子。(参见,例如,Wahl,G.M.andS.L.Berger(1987)MethodsEnzymol.152:399;Kimmel,A.R.(1987)MethodsEnzymol.152:507)。例如,严格的盐浓度将通常小于约750mMNaCl和75mM柠檬酸三钠,优选小于约500mMNaCl和50mM柠檬酸三钠,和更优选小于约250mMNaCl和25mM柠檬酸三钠。低严格杂交可在缺少有机溶剂,例如,甲酰胺的情况下获得,而高严格杂交可在存在至少约35%甲酰胺,和更优选至少约50%甲酰胺的情况下获得。严格的温度条件将通常包括至少约30℃、更优选至少约37℃和最优选至少约42℃的温度。变化的附加参数,如杂交时间、去垢剂——例如,十二烷基硫酸钠(SDS)——的浓度、和载体DNA的包含或排除对于本领域技术人员是熟知的。严格的多种水平通过组合这些多种如所需要的条件而实现。在优选实施方式中,杂交将在30℃在750mMNaCl、75mM柠檬酸三钠和1%SDS中发生。在更优选的实施方式中,杂交将在37℃在500mMNaCl、50mM柠檬酸三钠、1%SDS、35%甲酰胺和100μg/ml变性的鲑精DNA(ssDNA)中发生。在最优选的实施方式中,杂交将在42℃在250mMNaCl、25mM柠檬酸三钠、1%SDS、50%甲酰胺和200μg/mlssDNA中发生。关于这些条件的有用的变化对本领域技术人员将是显而易见的。为了最多应用,跟随杂交的清洗步骤也将在严格方面变化。清洗严格条件可由盐浓度和由温度限定。如上,清洗严格可通过减少盐浓度或通过增加温度而增加。例如,清洗步骤的严格的盐浓度将优选小于约30mMNaCl和3mM柠檬酸三钠,和最优选小于约15mMNaCl和1.5mM柠檬酸三钠。清洗步骤的严格的温度条件将通常包括至少约25℃,更优选至少约42℃,和甚至更优选至少约68℃的温度。在优选的实施方式中,清洗步骤将在25℃在30mMNaCl、3mM柠檬酸三钠和0.1%SDS中发生。在更优选的实施方式中,清洗步骤将在42℃在15mMNaCl、1.5mM柠檬酸三钠和0.1%SDS中发生。在更优选的实施方式中,清洗步骤将在68℃在15mMNaCl、1.5mM柠檬酸三钠和0.1%SDS中发生。这些条件的另外变化对本领域技术人员将是显而易见的。杂交技术对本领域技术人员来说是众做周知的,并在,例如,Benton和Davis(Science196:180,1977);Grunstein和Hogness(Proc.Natl.Acad.Sci.,USA72:3961,1975);Ausubeletal.(CurrentProtocolsinMolecularBiology,WileyInterscience,NewYork,2001);Berger和Kimmel(GuidetoMolecularCloningTechniques,1987,AcademicPress,NewYork);和Sambrooketal.,MolecularCloning:ALaboratoryManual,ColdSpringHarborLaboratoryPress,NewYork中描述。″基本上相同″指显示与参考氨基酸序列(例如,本文描述的氨基酸序列的任一个)或核酸序列(例如,本文描述的核酸序列的任一个)至少50%同一性的多肽或核酸分子。优选,这样的序列与用于比较的序列在氨基酸水平或核酸至少60%,更优选80%或85%,和更优选90%、95%、96%、97%、98%或甚至99%或更多相同。序列同一性通常使用序列分析软件(例如,UniversityofWisconsinBiotechnologyCenter,1710UniversityAvenue,Madison,Wis.53705的遗传学计算机组的序列分析软件包、BLAST、BESTFIT、GAP、或PILEUP/PRETTYBOX程序)来测量。这样的软件通过指定与多种置换、缺失、和/或其它修饰的同源性程度而使相同或相似序列相配。保守置换通常包括以下基团内的置换:甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸、谷氨酸、天冬酰胺、谷酰胺;丝氨酸、苏氨酸;赖氨酸、精氨酸;和苯丙氨酸、酪氨酸。在测定同一性程度的示例性方法中,可使用BLAST程序,e-3和e-100之间的概率得分指示密切相关的程序。如本文所用,术语“样品”包括生物样品如来自生物的任何组织、细胞、液体或其它材料。“特异地结合”指识别和结合分子(例如,核酸生物标志)的化合物(例如,核酸探针或引物),但是其基本上不识别和结合样品,例如,生物样品中的分子。″对象″指哺乳动物,包括,但不限于,人或非人哺乳动物,如牛、马、犬、羊或猫。术语“对象”可指动物,其是治疗、观察、或实验的对象(例如,患者)。″靶核酸分子″指将被分析的聚核苷酸。这样的聚核苷酸可以是靶序列的正义或反义链。术语″靶核酸分子″也指原始靶序列的扩增子。在多种实施方式中,靶核酸分子是一种或多种核酸生物标志如本文所用,术语″治疗(treat)″、治疗(treating)″、″治疗(treatment)″和类似表达指减轻或改善与其相关的病症和/或症状。将理解,虽然不排除,但是治疗病症或状况不需要与其相关的病症、状况或症状完全消除。本文提供的范围被理解为该范围内所有值的速记。例如,1至50的范围被理解为包括来自由1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50组成的组的任何数、数的组合或子范围。本文提供的任何化合物、组合物、或方法可与一个或多个本文提供的其它组合物和方法中的任一个组合。还应理解,本文使用的术语仅用于描述具体实施方式,且不意欲受限制。除非特别说明或根据上下文是明显的,如本文所用,术语“或”被理解为包括在内的。术语“包括”在本文用于指短语“包括但不限于”并与短语“包括但不限于”可互换地使用。如本文所用,术语“包括(comprises)”、“包括(compriseing)”、“包含(containing)”、“具有”和类似表达可具有美国专利法中归于它们的意思,并且可指“包括(includes)”“包括(including)”和类似表达;“基本上由……组成”或“基本上组成“同样具有美国专利法中归于它们的意思,并且该术语是开放式的,允许超过所列举项的存在,只要所列举项的基本或新的特性没有被超过所列举项的存在而改变,但是排除现有技术实施方式。本发明的其它特点和优势根据以下其想要的实施方式的描述和根据权利要求将是明显的。附图简述图1,包括图1A和图1B,描述几个当前的用于测试微生物(例如,病原微生物)存在的选项。图1A描述当前的测试选项中涉及的特点。特别地,当前的测试选项需要培养,用于随后通过抗体珠捕获、DNA-珠捕获、聚合酶链反应、免疫测定、DNA探针扩增,菌落计数、和限制酶切消化绘图的分析。当前的测试选项也限于每个测试一个分析的靶向生物。图1B是比较当前的测试选项的具体特点的表。图2,包括图2A和图2B,描述PathoChip的设计。图2A描述用于PathoChip探针选择的宏基因组的使用。所有病毒和选择的人病原微生物的序列登录(accession)从NCBIDNA序列数据库检索并连接以形成宏基因组。只要有可能,对登录(a,c)独特的靶序列区域用于选择多个60nt探针(数字1、2、4-6)用于微阵列合成,并且在至少两个病毒登录(b)中共享相似序列的靶区域的探针也被识别。原核和真核病原体的探针可绘制到基因间、基因或核糖体RNA序列、或靶类型的混合物,取决于序列数据的可用性。图2B是设计PathoChip的过程的示意图。平行和反复的设计程序用于组装覆盖独特和保守的靶区域的PathoChip探针收集,补充有针对已知癌症相关微生物叠瓦(tiling)的高分辨率探针。图3,包括图3A和3B,描述使用PathoChip的样品筛选工作流。图3A描述不需要培养步骤来制备用于具有PathoChip的样品。图3B描述用于含有DNA和RNA的样品制备的核酸提取方法。1不知道什么细菌/病毒材料可在二甲苯去石蜡化期间丧失,2来自该旋转的片状沉淀物应含有大的基因组DNA、保持完整的细胞和细胞碎片。旋转可能不足以把完整的病毒颗粒弄成球状,3这里病毒DNA仅来自未弄成球状(unpelleted)的完整颗粒。从溶解的宿主细胞释放的病毒DNA应处于小球状。病毒RNA来自完整颗粒或溶解的宿主细胞,480或90℃逆转福尔马林交联。5小的等分部分,保持从任何未弄成球状的完整颗粒或细胞回收核酸的机会。图4列出了使用多个靶向序列,PathoChipv3中探针组能够检测的食物传播的病原体,包括76种生物。图5,包括图5A至图5I,描述用于检测靶种类的探针的鉴定。图5A是描述探针(例如,用于检测产气荚膜梭菌)的选择和抛弃的图表。图5B是描述用于检测嗜肺军团病杆菌的探针选择的图表。图5C是描述用于检测小肠结肠炎耶尔森菌的探针选择的图表。图5D是描述用于检测大肠杆菌的探针选择的图表。图5E是描述用于检测霍乱弧菌的探针选择的图表。图5F是描述用于检测产气荚膜梭菌的探针选择的图表。图5G是描述用于检测肠道沙门氏菌的探针选择的图表。图5H是描述用于检测弗氏志贺菌的探针选择的图表。图5I是描述用于检测单核细胞增生利斯特菌的探针选择的图表。使用含有每个靶1000、100、10或1个细胞的稀释的原种的等分部分用于DNA+RNA提取、扩增、和杂交到PathoChipv3,分析针对每个靶的所有探针以鉴定具有高灵敏度的探针亚组。对于每个靶向的生物,选择显示适当的检测响应的探针。以该方式选择的探针的亚组在随后的研究中用作测定组。图6,包括图6A至图6H,显示总计选择的探针以报告单个检测信号。图6A是描述来自检测肠道沙门氏菌的选择的探针的信号的总计的图表。图6B是描述来自检测单核细胞增生利斯特菌的选择的探针的信号的总计的图表。图6C是描述来自检测弗氏志贺菌的选择的探针的信号的总计的图表。图6D是描述来自检测产气荚膜梭菌的选择的探针的信号的总计的图表。图6E是描述来自检测小肠结肠炎耶尔森菌的选择的探针的信号的总计的图表。图6F是描述来自检测霍乱弧菌的选择的探针的信号的总计的图表。图6G是描述用于检测大肠杆菌O157:H7的探针选择的图表。图6H是描述用于检测嗜肺军团病杆菌的探针选择的图表。图7,包括图7A至图7H,显示针对当与人和莴苣细胞混合时的多种细菌特异的选择的探针组的检测信号。图7A是描述计算为针对每个测试样品(实线)和对照样品背景(虚线)的选择的探针的检测信号总计的图表(例如,用于检测与人和莴苣细胞混合的产气荚膜梭菌)。图7B是描述测定含有与人和莴苣细胞混合的不同数目大肠杆菌O157:H7细胞的样品的选择的探针组的检测信号的图表。图7C是描述测定含有与人和莴苣细胞混合的不同数目嗜肺军团病杆菌细胞的样品的选择的探针组的检测信号的图表。图7D是描述测定含有与人和莴苣细胞混合的不同数目单核细胞增生利斯特菌细胞的样品的选择的探针组的检测信号的图表。图7E是描述测定含有与人和莴苣细胞混合的不同数目肠道沙门氏菌细胞的样品的选择的探针组的检测信号的图表。图7F是描述测定含有与人和莴苣细胞混合的不同数目弗氏志贺菌细胞的样品的选择的探针组的检测信号的图表。图7G是描述测定含有与人和莴苣细胞混合的不同数目霍乱弧菌细胞的样品的选择的探针组的检测信号的图表。图7H是描述测定含有与人和莴苣细胞混合的不同数目小肠结肠炎耶尔森菌细胞的样品的选择的探针组的检测信号的图表。大量宿主细胞背景中少数病原体细胞可被检测,但是具有与纯病原体培养物相比较少的绝对信号(参见图6)。测试信号和仅有宿主的对照信号之间的差异指示检测能力。定量病原体量的能力需要较仅检测存在或缺乏的能力更多的细胞。图8,包括图8A至图8H,显示针对当与牛奶混合时的多种细菌特异的选择的探针组的检测信号。图8A是描述计算为针对每个测试样品(实线)和对照样品背景(虚线)的选择的探针的检测信号总计的图表(例如,用于检测牛奶中的产气荚膜梭菌)。图8B是描述测定含有牛奶中不同数目鼠弓形体细胞的样品的选择的探针组的检测信号的图表。图8C是描述测定含有牛奶中不同数目霍乱弧菌细胞的样品的选择的探针组的检测信号的图表。图8D是描述测定含有牛奶中不同数目小肠结肠炎耶尔森菌细胞的样品的选择的探针组的检测信号的图表。图8E是描述测定含有牛奶中不同数目大肠杆菌O157:H7细胞的样品的选择的探针组的检测信号的图表。图8F是描述测定含有牛奶中不同数目嗜肺军团病杆菌细胞的样品的选择的探针组的检测信号的图表。图8G是描述测定含有牛奶中不同数目肠道沙门氏菌细胞的样品的选择的探针组的检测信号的图表。图8H是描述测定含有牛奶中不同数目弗氏志贺菌细胞的样品的选择的探针组的检测信号的图表。图9,包括图9A至图9H,显示针对当与番茄混合时的多种细菌特异的选择的探针组的检测信号。图9A是描述测定含有不同数目与番茄混合的产气荚膜梭菌细胞的样品的选择的探针组的检测信号的图表。图9B是描述测定含有不同数目与番茄混合的鼠弓形体细胞的样品的选择的探针组的检测信号的图表。图9C是描述测定含有不同数目与番茄混合的霍乱弧菌细胞的样品的选择的探针组的检测信号的图表。图9D是描述测定含有不同数目与番茄混合的小肠结肠炎耶尔森菌细胞的样品的选择的探针组的检测信号的图表。图9E是描述测定含有不同数目与番茄混合的大肠杆菌O157:H7细胞的样品的选择的探针组的检测信号的图表。图9F是描述测定含有不同数目与番茄混合的嗜肺军团病杆菌细胞的样品的选择的探针组的检测信号的图表。图9G是描述测定含有不同数目与番茄混合的弗氏志贺菌细胞的样品的选择的探针组的检测信号的图表。图9H是描述测定含有不同数目与番茄混合的肠道沙门氏菌细胞的样品的选择的探针组的检测信号的图表。图10,包括图10A至图10D,显示针对当与蛤混合时的多种细菌特异的选择的探针组的检测信号。图10A是描述测定含有不同数目与蛤混合的产气荚膜梭菌细胞的样品的选择的探针组的检测信号的图表。图10B是描述测定含有不同数目与蛤混合的鼠弓形体细胞的样品的选择的探针组的检测信号的图表。图10C是描述测定含有不同数目与蛤混合的霍乱弧菌细胞的样品的选择的探针组的检测信号的图表。图10D是描述测定含有不同数目与蛤混合的小肠结肠炎耶尔森菌细胞的样品的选择的探针组的检测信号的图表。图11是描述对患者样品的PathoChip的60,000个探针的附加分析的图表。附加分析鉴定与对照相比与患者样品中根毛霉菌属的真菌相关的强信号。将登录信号定义为每个登录所有探针的每个登录-平均红色(r)的所有探针的平均绿色(g)。图12,包括图12A和12B,是显示登录分析选择的登录的所有探针的杂交信号的热图数据。图12A是使用PathoChip从患者和对照样品的分析产生的热图。图12B显示消除未被检测的或也存在于对照中的探针之后的热图。剩余的探针指示真菌杂交信号。图13是显示微小根毛霉菌株NRRL28626和miehel根毛霉菌具有来自屏幕的最显著的信号的图表。患者样品中的前4个病原体——提供高登录信号——是真菌,包括微小根毛霉菌株NRRL28626、miehel根毛霉菌、微小根毛霉、和喉红酵母属(Rhodotorulalaryngis)。发明详述如本文所述,本发明描写了用于包括来自多种来源和/或生物(例如,宏基因组、微生物群系)的遗传物质的样品中一种或多种生物标志检测的组合物和方法的特征。特别地,申请人已发展了产生用于来自多个致病生物和因子(例如病毒)的遗传物质的检测的多组核苷酸的方法,以及制备用于分析的包括总核酸提取物(例如,DNA和RNA)的样品的方法。如本文所述,含有针对所有公开的病毒序列和数百个致病细菌、真菌、和蠕虫的探针的PathoChip平台的发展提供以经济模式的宽的病原体覆盖度。PathoChip平台通过提供由产品保存期限引起的更快的结果——其对制造商和配售商重要——而区别于当前的技术。一方面,PathoChip平台可用于对患者诊断进行临床分析,因此具有影响患者治疗和护理的潜力。在可能的情况下,针对靶基因组的独立区域的多个探针用于提高检测的机会。虽然PathoChip内容发展自已知靶的序列,但是发现新菌株或生物的一些能力通过包含针对病毒家族之内和之间是保守的序列的探针来提供;具有与保守序列同源性的先前未知的病毒可产生在该探针的相应的杂交信号,如果不是针对完整的探针组。支持工作流被描述用以描绘生物学和环境样品,和包括DNA和RNA的同时检测以扩大可用于杂交的靶的范围。PathoChip平台在非食品应用,以及食品样品中主要细菌病原体的检测中具有展示的成功。靶核酸分子本发明的方法和组合物用于将被分析的测试样品或材料中靶核酸分子的鉴定。靶序列从包括靶核酸分子的任何样品——包括但不限于环境、非生物和生物样品——扩增。这样的样品可包括真菌、孢子、病毒、或细胞(例如,原核生物、真核生物)。在具体实施方式中,本发明的的组合物和方法检测一种或多种致病生物——包括病毒、类病毒、细菌、真菌、蠕虫、和/或原生动物。示例性的测试样品包括体液(例如血液、血清、血浆、羊膜液、痰、尿、脑脊液、淋巴、泪液、粪便、或胃液)、组织提取物、培养基(例如,细胞如病原体细胞已在其中生长的液体)、环境样品、农产品或其它食品、和它们的提取物、DNA鉴定标签。如果需要,将样品在检测之前使用通常用于从生物样品分离核酸分子的任何标准方法纯化。在一个实施方式中,将病原体的靶核酸通过引物/模板寡核苷酸来扩增以检测样品中病原体的存在。示例性的病原体包括真菌、细菌、病毒和酵母。这样的病原体可通过鉴定测试样品中编码病原体核酸序列的核酸分子来检测。在一个实施方式中,样品是生物样品,如组织样品。一种或多种聚核苷酸生物标志(例如,以检测或鉴定病毒、细菌、真菌、蠕虫、和/或原生动物)的水平在不同类型的生物样品中测量。在一个实施方式中,生物样品是包括组织或器官的细胞的组织样品,例如,来自活组织检查。在另一个实施方式中,生物样品是生物液体样品。生物液体样品包括脑脊液血液、血清、血浆、尿、和唾液、或用于本发明的方法的任何其它的生物液体。在另一个实施方式中,样品是环境样品,如土壤、沉积物水、或空气。环境样品可获自工业来源如农场、废物流、或水源。为了环境应用,测试样品可包括水、空气过滤器的液体提取物、土壤样品、建筑材料(例如,干式墙、天花板瓦、建筑纸板、织物、墙纸和地板覆盖物)、环境拭子、或任何其它样品。靶核酸分子包括双链和单链核酸分子(例如,DNA、RNA和本领域已知的能够与本文描述的核酸分子杂交的其它核酸碱基聚合物)。适合于用本发明的可检测的寡核苷酸探针或可检测的引物/模板寡核苷酸检测的RNA分子包括,但不限于,包括靶序列的双链和单链RNA分子(例如,信使RNA、病毒RNA、核糖体RNA、转移RNA、小RNA和小RNA前体、和siRNAs或本文描述的或本领域已知的其它RNAs)。适合于用本发明的可检测的寡核苷酸探针或引物/模板寡核苷酸检测的DNA分子包括,但不限于,双链DNA(例如,基因组DNA、质粒DNA、线粒体DNA、病毒DNA、和合成的双链DNA)。单链DNA靶核酸分子包括,例如,病毒DNA、cDNA、和合成的单链DNA、或本领域已知的其它类型的DNA。一般而言,用于检测的靶序列的长度在约30和约300个核苷酸之间(例如,10、15、20、25、30、35、40、45、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300个核苷酸)。在具体实施方式中靶序列的长度是约60个核苷酸。用于检测的靶序列还可具有与探针序列至少约70、80、90、95、96、97、98、99、或甚至100%的同源性。探针序列可以较靶序列更长或更短例如,60-核苷酸探针可与至少约44个核苷酸的靶序列杂交。在具体实施方式中,生物标志是区别地存在于样品(例如,生物、非生物或环境样品)中的生物分子(例如,核酸分子)。例如,生物标志取自如与另一个表型状态(例如,不具有疾病)相比的一个表型状态(例如,具有疾病)的对象。如果不同组中生物标志的平均或中间表达水平被计算为统计学上显著的,则生物标志区别地存在于不同的表型状态之间。统计学显著性的通常检验包括t-检验、ANOVA、Kruskal-Wallis、Wilcoxon、Mann-Whitney和比值比。生物标志,单独或组合,提供对象属于一个表型状态或另一个的相对危险度的测量。因此,它们用作表征疾病的标志。探针选择本发明提供选择的用于检测多个靶核酸分子(例如,对应于多个生物(bioorganisms))的探针组。在多种实施方式中,本发明提供宏基因组、其构建、和其在本发明的方法中的使用。如本文所用“宏基因组”指来自超过一个生物的遗传物质,例如,在环境样品中。宏基因组用于选择探针组和/或验证探针组。在一些实施方式中,宏基因组包括约20、30、40、50、60、70、80、90、100、200、300、400、500、1000、1500、2000个或更多生物的序列或基因组。在一个实例中,将数千生物的核酸序列连接以产生包括58个染色体的宏基因组。不连续的宏基因组探针选择A.将个体基因组、基因和部分序列下载到登录的局部数据库中B.使用生物信息学工具掩蔽低复杂性序列。在一个实例中,低复杂性序列使用mdust(http://doc.bioperl.org/bioperl-run/lib/Bio/Tools/Run/Mdust.html)掩蔽,之后是病毒登录中独特区域的BLASTN2.0MP-WashU31鉴定。C.针对所有其它登录的每个登录的BLASTN序列比较D.鉴定每个登录中的特异靶区域1.250-300bp区域2.至多50个具有与任何其它登录或与人基因组70%或更大序列同源性的连续的核苷酸E.补充特异靶1.用零或一个靶区域鉴定任何登录2.放宽严格参数到至多30个具有与任何其它登录50%或更大序列同源性的连续核苷酸,但是至多50个具有与人基因组70%或更大序列同源性的连续核苷酸3.从1.E.1对登录亚组再次进行靶区域鉴定。F.鉴定保守的靶区域1.具有与至少一个其它登录70%或更大同源性的70-300bp区域2.除去具有50或更多个具有与人基因组70%或更大序列同源性的连续核苷酸的保守的靶G.选择探针1.对特异和保守的靶区域进行Agilent阵列CGH探针选择算法2.通过Agilent设计得分排列探针3.从每个登录中1-5个特异的靶区域选择1-3个排名最高的探针4.从每个保守的靶区域选择1-3个排名最高的探针连锁的宏基因组探针选择A.将个体基因组、基因和部分序列下载到登录的局部数据库中B.将所有的登录编辑进单个连锁的宏基因组以使基因组生物信息学工具的使用容易1.在每个登录之间放置100个非特异的核苷酸(″N″)作为间隔区2.将登录和间隔区加入6百万-1千万个碱基的染色体中C.针对宏基因组中的特异性进行Agilent阵列CGH探针选择算法D.对针对人、小鼠和/或其它哺乳动物基因组的特异性过滤探针E.选择特异的探针1.通过Agilent设计得分排列探针2.从每个登录选择10-20个排名最高的探针3.探针之间需要至少100bp分离F.选择保守的探针1.如在1.F.中鉴定保守的区域2.从每个保守区域选择5-10个排名最高的探针3.探针之间需要至少100bp分离G.经验的探针选择1.制造含有所有特异和保守的探针的微阵列2.使微阵列与标记的人DNA杂交3.从每个登录选择5-10个具有最低交叉杂交信号的特异的探针4.从每个保守区域选择3-5个具有最低交叉杂交信号的保守的探针样品制备本发明还提供分析存在于样品中的多个类型核酸——包括DNA和RNA——的方法。在各种实施方式中,样品制备包括提取核酸分子(例如,DNA和RNA)的混合物。在其它实施方式中,样品制备包括提取来自多个生物、细胞类型、传染因子、或其任何组合的核酸混合物。在一个实施方式中,样品制备包括下面的工作流。A.使基因组DNA成为片段B.通过随机引物逆转录酶将总RNA转换成第一链cDNAC.通过化学或酶结合用生物素或荧光染料标记基因组DNAD.通过化学或酶结合用生物素或荧光染料标记cDNAE.在相同的化学或酶反应中标记基因组DNA和cDNA的混合物F.混合C+D和与探针的微阵列共杂交G.使E与探针的微阵列杂交H.扩增靶向的基因组DNA1.使用全部基因组扩增(GEGenomiPhi,SigmaWGA,NuGENOvationDNA)来非特异地扩增基因组DNA2.使用如针对4.C或4.E.所输入的扩增产物I.扩增靶向总RNA1.使用全部转录组扩增(SigmaWTA,Ambioninvitrotranscription,NuGENOvationRNA)来非特异地扩增总RNA2.使用如针对4.D.或4.E.所输入的扩增产物使样品与微阵列(例如,PathoChip)杂交,和将微阵列以多种严格性清洗。扫描微阵列用于荧光检测。应用背景校正和阵列间标准化算法。应用检测阈。针对统计学显著性分析结果。核酸扩增将靶核酸序列在检测之前任选地扩增。术语“扩增”定义从单个或较低拷贝数的核酸序列分子制备多拷贝核酸的过程。核酸序列的扩增在体外通过本领域技术人员已知的生物化学过程进行。在鉴定之前或与鉴定同时,病毒样品可通过许多种机制扩增,机制中的一些可利用PCR。例如,用于长距离PCR的引物可被设计以扩增序列的区域。对于RNA病毒,第一逆转录酶步骤可用于从单链RNA产生双链DNA。参见,例如,PCRTechnology:PrinciplesandApplicationsforDNAAmplification(Ed.H.A.Erlich,FreemanPress,NY,N.Y.,1992);PCRProtocols:AGuidetoMethodsandApplications(Eds.Innis,etal.,AcademicPress,SanDiego,Calif.,1990);Mattilaetal.,NucleicAcidsRes.19,4967(1991);Eckertetal.,PCRMethodsandApplications1,17(1991);PCR(Eds.McPhersonetal.,IRLPress,Oxford);和美国专利号4,683,202、4,683,195、4,800,1594,965,188和5,333,675。样品可在阵列上扩增。参见,例如,美国专利号6,300,070和美国系列号09/513,300。其它合适的扩增方法包括连接酶链反应(LCR)(例如,WuandWallace,Genomics4,560(1989),Landegrenetal.,Science241,1077(1988)和Barringeretal.Gene89:117(1990))、转录扩增(Kwohetal.,Proc.Natl.Acad.Sci.USA86,1173(1989)和WO88/10315)、自主序列复制(Guatellietal.,Proc.Nat.Acad.Sci.USA,87,1874(1990)和WO90/06995)、靶聚核苷酸序列的选择性扩增(美国专利号6,410,276)、共有序列引物PCR(CP-PCR)(美国专利号4,437,975)、任意引物PCR(AP-PCR)(美国专利号5,413,909,5,861,245)和基于核酸的序列扩增(NABSA)(参见,美国专利号5,409,818、5,554,517、和6,063,603)。可使用的其它扩增方法在,美国专利号5,242,794,5,494,810,4,988,617中和在美国系列号09/854,317中描述。样品制备的另外方法和减少核样品复杂性的技术在Dongetal.,GenomeResearch11,1418(2001)中,在美国专利号6,361,947、6,391,592和美国系列号09/916,135、09/920,491(美国专利申请公开20030096235)、09/910,292(美国专利申请公开20030082543)、和10/013,598中描述。生物标志的检测该发明的生物标志可通过任何合适的方法来检测。本文描述的方法可单独或组合使用,用于更准确的生物标志检测。在本领域中已发展了进行聚核苷酸杂交测定的方法。杂交测定程序和条件将依赖应用而变化,并根据已知的一般的结合方法来选择,包括以下所提到的:SambrookandRussell,MolecularCloning:ALaboratoryManual(3rdEd.ColdSpringHarbor,N.Y,2001);BergerandKimmelMethodsinEnzymology,Vol.152,GuidetoMolecularCloningTechniques(AcademicPress,Inc.,SanDiego,Calif.,1987);YoungandDavism,P.N.A.S,80:1194(1983)。进行重复和可控的杂交反应的方法和装置已在美国专利号5,871,928、5,874,219、6,045,996和6,386,749、6,391,623中描述。用于解释来自阵列的杂交结果的数据分析算法(E-预测)可公开地获得(参见Urisman,2005,GenomeBiol6:R78)。在一个实施方式中,杂交的核酸通过检测一种或多种附着于样品核酸或掺入样品核酸内的标记来检测。标记可通过本领域技术人员熟知的许多方法中的任何一个来附着或掺入。在一个实施方式中,标记在样品核酸制备中的扩增步骤期间同时掺入。因此,例如,具有标记的引物或标记的核苷酸的PCR将提供标记的扩增产物。在另一个实施方式中,如上所述,使用标记的核苷酸(例如荧光素-标记的UTP和/或CTP)的转录扩增将标记掺入转录的核酸中。在另一个实施方式中将PCR扩增产物分成碎片和通过末端脱氧转移酶和标记的dNTPs标记。可选地,标记可直接加到最初的核酸样品(例如,mRNA、polyAmRNA、eDNA等)或在扩增完成之后加到扩增产物。将标记附着于核酸的方法对本领域技术人员是熟知的并包括,例如,切口平移或末端标记(例如用标记的RNA)——其通过激酶激活核酸和将样品核酸与标记(例如,荧光基团)连接的核酸连接体的随后附着(连接)。在另一个实施方式中使用末端脱氧转移酶将标记加到片段末端。适合用于本发明的可检测的标记包括通过分光镜、光化学、生物化学、免疫化学、电学、光学或化学方法可检测的任何组合物。本发明中有用的标记包括,但不限于:用于用标记的链霉抗生物素结合物染色的生物素;抗生物素抗体、磁珠(例如,DynabeadsTM.);荧光染料(例如,荧光素、德克萨斯红、罗丹明、绿色荧光蛋白等);放射性标记(例如,3H、125I、35S、4C或32p);发磷光的标记;酶(例如,辣根过氧化物酶、碱性磷酸酶和ELISA中通常使用的其它酶);和色度法标记如胶体金或有色玻璃或塑料(例如,聚苯乙烯、聚丙烯、胶乳等)珠。教导这样的标记的使用的专利包括美国专利号3,817,837、3,850,752、3,939,350、3,996,345、4,277,437、4,275,149和4,366,241。检测这样的标记的方法对本领域技术人员是熟知的。因此,例如,放射性标记可使用照相胶片或闪烁计数器来检测;荧光标志可使用光检测器来检测以检测发出的光。酶标记通常通过将底物提供给酶和检测通过底物上酶的作用而产生的反应产物来检测,和测热标记通过仅使有色标记看得见来检测。用于信号检测和强度数据处理的方法和装置在以下中公开,例如,美国专利号5,143,854、5,547,839、5,578,832、5,631,734、5,800,992、5,834,758;5,856,092、5,902,723、5,936,324、5,981,956、6,025,601、6,090,555、6,141,096、6,185,030、6,201,639;6,218,803;和6,225,625美国系列号10/389,194、60/493,495和PCT申请PCT/US99/06097(公布为WO99/47964)。通过生物芯片的检测在本发明的方面中,样品通过生物芯片(也称作微阵列)来分析。本发明的核酸分子用作生物芯片中可杂交的阵列元件。生物芯片通常包括固体基底和具有通常平的表面,捕获试剂(也称作吸附或亲和试剂)附着到该表面。经常地,生物芯片表面包括多个可寻址的位置,其每个都有捕获试剂结合在那里。以有序的方式组织阵列元件以便每个元件存在于基底上的指定位置。有用的基底材料包括由纸、尼龙或其它材料组成的膜、过滤器、芯片、载玻片、和其它固体载体。阵列元件的有序排列允许杂交模式和强度被解释为特定基因或蛋白质的表达水平。制备核酸微阵列的方法对技术人员是已知的和在以下中描述,例如,美国专利号5,837,832,Lockhart,etal.(Nat.Biotech.14:1675-1680,1996)、和Schena,etal.(Proc.Natl.Acad.Sci.93:10614-10619,1996),其在本文通过引用被并入。美国专利号5,800,992和6,040,138描述制备可用于检测含有特定核苷酸序列的核酸存在的核酸探针阵列的方法。用最小数目的合成步骤形成核酸、肽和其它聚合物序列的高密度阵列的方法是已知的。核酸阵列可通过许多种方法在固体基底上合成,这些方法包括,但不限于,光定向化学偶联和机械定向偶联。对于关于重新测序阵列的另外描述和方法参见美国专利申请系列号10/658,879、60/417,190、09/381,480、60/409,396和美国专利号5,861,242、6,027,880、5,837,832、6,723,503。通过核酸生物芯片的检测在本发明的方面,样品通过核酸生物芯片(也称作核酸微阵列)来分析。为了产生核酸生物芯片,使用化学偶联操作和喷墨应用装置可将寡核苷酸可合成或结合到基底表面,如PCT申请W095/251116(Baldeschweileretal.)中所描述的。可选地,使用真空系统、热、UV、机械或化学键合操作,网格阵列可用于排列和连接cDNA片段或寡核苷酸至基底表面。用于本发明的示例性的核酸分子包括特异地结合核酸生物标志至一种或多种致病生物的聚核苷酸、和其片段。来自生物样品的核酸分子(例如RNA或DNA)可用于产生杂交探针,如本文描述的。生物样品通常来自患者,例如,作为体液(如血液、血清、血浆、唾液、尿、腹水、囊肿液等);匀浆的组织样品(例如,通过活组织检查获得的组织样品);或分离自患者样品的细胞。为了一些应用,可使用培养的细胞或其它组织制备物。mRNA根据标准的方法来分离,产生cDNA并用作模板以制备适合杂交的互补的RNA。这样的方法在本领域众所周知。在存在荧光核苷酸的情况下扩增RNA,然后将标记的探针与微阵列温育以允许探针序列与结合到生物芯片的互补的寡核苷酸杂交。调节温育条件以便杂交发生,具有精确的互补的匹配或具有多种较少的互补性程度——取决于利用的严格度。例如,严格的盐浓度将通常小于约750mMNaCl和75mM柠檬酸三钠,小于约500mMNaCl和50mM柠檬酸三钠,或小于约250mMNaCl和25mM柠檬酸三钠。低严格杂交可在缺少有机溶剂,例如,甲酰胺的情况下获得,而高严格杂交可在存在至少约35%甲酰胺,和最优选至少约50%甲酰胺的情况下火的。严格的温度条件将通常包括至少约30C、至少约37C、或至少约42C的温度。不同的另外的参数,如杂交时间、去垢剂例如十二烷硫酸钠(SDS)的浓度、和载体DNA的包含或排除对本领域技术人员是熟知的。如需要,严格的多种水平通过组合这些不同的条件而实现。在优选的实施方式中,杂交将在30C在750mMNaCl、75mM柠檬酸三钠、和1%SDS中发生。在实施方式中,杂交将在37C在500mMNaCl、50mM柠檬酸三钠、1%SDS、35%甲酰胺、和100μg/ml变性的鲑精DNA(ssDNA)中发生。在其它实施方式中,杂交将在42C在250mMNaCl、25mM柠檬酸三钠、1%SDS,50%甲酰胺、和200μg/mlssDNA中发生。这些条件的有用变化对本领域技术人员将是显而易见的。非杂交的探针的去除可,例如,通过清洗而实现。跟随杂交的清洗步骤在严格方面还可变化。清洗严格条件可通过盐浓度和通过温度来限定。如上,清洗严格可通过降低盐浓度或通过增加温度而增加。例如,用于清洗步骤的严格的盐浓度将优选是小于约30mMNaCl和3mM柠檬酸三钠,和最优选小于约15mMNaCl和1.5mM柠檬酸三钠。用于清洗步骤的严格的温度条件将通常包括至少约25C、至少约42C、或至少约68C的温度。在实施方式中,清洗步骤将在25C在30mMNaCl、3mM柠檬酸三钠、和0.1%SDS中发生。在更优选的实施方式中,清洗步骤将在42C在15mMNaCl、1.5mM柠檬酸三钠、和0.1%SDS中发生。在其它实施方式中,清洗步骤将在68C在15mMNaCl、1.5mM柠檬酸三钠、和0.1%SDS中发生。这些条件的另外变化对本领域技术人员将是显而易见的。用于测量针对所有不同的核酸序列的杂交的存在、缺乏和量的检测系统在本领域众所周知。例如,同时的检测在Helleretal.,Proc.Natl.Acad.Sci.94:2150-2155,1997中描述。在实施方式中,扫描仪用于测定和荧光的水平和模式。诊断测定本发明提供许多诊断测定,其用于鉴定或表征疾病或病症(例如,传染病)、或发展这样的状况的倾向。在一个实施方式中,疾病、病症、或状况通过定量一种或多种来自一种或多种致病生物——包括病毒、类病毒、细菌、真菌、蠕虫、和原生动物——的生物标志的水平来表征。虽然下面提供的实例描述了检测这些标志的水平的方法,但是技术人员理解,本发明不限于这样的方法。标志水平通过任何标准方法是可定量的,这样的方法包括,但不限于实时PCR、Southern印迹、PCR、和/或质谱法。本文描述的标志的任何两种或更多的水平定义疾病、病症、状况的标志概况。将标志的水平与参考比较。在一个实施方式中,参考是存在于获自不具有疾病、病症、或状况的患者的对照样品的标志的水平。在另一个实施方式中,参考是在疾病、病症、或状况的治疗之前、期间、或之后来自患者的生物样品的标志的基线水平。在再一个实施方式中,参考是标准化的曲线。本文描述的标志(例如,病毒、细菌、真菌、蠕虫、和/或原生动物生物标志的组合)的任何一种或多种的水平单独或与其它标准方法组合使用以表征疾病、病症、或状况。在硬件和/或软件中的执行本文描述的方法可在通用或特别程序设计的硬件或软件上执行。例如,该方法可通过计算机可读介质执行。相应地,本发明还提供软件和/或计算机程序产物,其被配置以进行根据本发明的任何实施方式的算法和/或方法。本领域技术人员熟知如何配置可进行本发明中提供的算法和/或方法的软件。计算机可读介质可以是非短暂的和/或有形的。例如,计算机可读介质可以是易失性存储器(例如,随机存取存储器等)或非易失性存储器(例如,只读存储器、硬盘、软盘、磁带、光盘、纸桌(papertable)、穿孔卡等)。计算机可执行指令可以以合适的计算机语言或几种语言的组合来书写。基本的计算生物学方法在,例如Setubal和Meidanisetal.,IntroductiontoComputationalBiologyMethods(PWSPublishingCompany,Boston,1997);Salzberg,Searles,Kasif,(Ed.),ComputationalMethodsinMolecularBiology,(Elsevier,Amsterdam,1998);RashidiandBuehler,BioinformaticsBasics:ApplicationinBiologicalScienceandMedicine(CRCPress,London,2000)andOueletteandBzevanisBioinformatics:APracticalGuideforAnalysisofGeneandProteins(Wiley&Sons,Inc.,2nded.,2001)中描述。本发明还可利用多种计算机程序产物和软件用于许多种目的,如探针设计、数据管理、分析、和仪器操作。(参见,美国专利号5,593,839、5,795,716、5,733,729、5,974,164、6,066,454、6,090,555、6,185,561、6,188,783、6,223,127、6,229,911和6,308,170)。另外,本发明可具有优选的实施方式,其包括在网络如因特网上提供遗传信息的方法,如美国系列号10/197,621、10/063,559(美国公开号20020183936)、10/065,856、10/065,868、10/328,818、10/328,872、10/423,403和60/482,389中所示。试剂盒本发明提供用于生物标志检测的试剂盒,所述生物标志指示一种或多种能引起疾病、病症、或状况的生物制剂的存在。试剂盒可用于检测多个能引起一种或多种疾病或病症的生物制剂的存在。试剂盒可用于疾病、病症、或状况的诊断。在一些实施方式中,试剂盒包括针对核酸生物标志的探针组或收集(例如,PathoChip)。在一些实施方式中,试剂盒包括一种或多种无菌容器,其含有针对核酸生物标志的探针组、或微阵列芯片。这样的容器可以是盒、安瓿、瓶子、管形瓶、管、袋、小袋、泡罩包装、或本领域已知的其它合适的容器形式。这样的容器可由塑料、玻璃、层压纸、金属箔、或适于容纳药物的其它材料。说明书将通常包括信息关于用于疾病或病症的检测或诊断的组合物的使用。在其它实施方式中,说明书包括以下中的至少一个:治疗剂的描述;用于疾病、病症、或其症状的治疗或预防的剂量日程表和施用;警惕;警告;适应证;相反的适应证(counter-indications);超剂量信息;不良反应;动物药理学;临床研究、和/或参考。说明书可直接印刷在容器(当存在时)上,或作为应用到容器的标签,或作为容器中提供的或同容器一起提供的单独的纸、小册子、卡片或折叠式印刷品。除非另外指出,本发明的实施利用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术,其在技术人员的视界内是好的。这样的技术在文献中被充分说明,如,“MolecularCloning:ALaboratoryManual”,secondedition(Sambrook,1989);“OligonucleotideSynthesis”(Gait,1984);“AnimalCellCulture”(Freshney,1987);“MethodsinEnzymology”“HandbookofExperimentalImmunology”(Weir,1996);“GeneTransferVectorsforMammalianCells”(MillerandCalos,1987);“CurrentProtocolsinMolecularBiology”(Ausubel,1987);“PCR:ThePolymeraseChainReaction”,(Mullis,1994);“CurrentProtocolsinImmunology”(Coligan,1991)。这些技术适用于本发明的聚核苷酸和多肽的产生,并且,像这样,可在产生和实施本发明中被考虑。用于具体实施方式的具体有用的技术将在下面的部分中讨论。以下实施例被列出以提供给本领域普通技术人员如何制备和使用本发明的测定、筛选、和治疗方法的全部公开和描述,并且不意欲限制发明人视为他们的发明的范围。实施例实施例1.材料和方法微阵列设计针对所有的分类学=病毒注释,和针对来自通过文献检索和网资源(www.niaid.nih.gov:EmergingandRe-emergingInfectiousDiseases,CategoryA,B,andCPriorityPathogens)编辑的原核和真核的人病原体列表的登录,查询针对基因组、基因和核苷酸登录的国家生物技术信息中心(NCBI)数据库(www.ncbi.nlm.nih.gov/pubmed)。产生的登录组装成非冗余的连锁,登录之间具有100N核苷酸分离器。将该宏基因组分成58条“染色体”,每个的长度大约5百万-1千万个核苷酸,并提交给AgilentTechnologies(SantaClaraCA,USA)作为定制设计项目。探针序列(50-60nt)使用Agilent阵列比较的基因组杂交(aCGH)设计算法来选择,然后针对与人基因组序列交叉杂交的低可能性过滤。独立地,使用mdust(http://doc.bionerl.org/bioperl-run/lib/Bio/Tools/Run/Mdust.html)掩蔽宏基因组中低复杂性区域,之后是病毒登录中独特区域的BLASTN2.0MP-WashU31鉴定。独特区域标准是250-300bp和<50个连续bp,具有与任何其它宏基因组登录中的序列>70%同源性。保守的病毒区域使用70-300bp和与至少一个其它病毒但不是人序列>70%同源性的标准被相似地鉴定。如果针对来源登录获得少于10个探针,则将绘制到独特或保守的病毒区域、或任何原核或真核病原体登录的所有的Agilent设计的探针通过默认加入到微阵列设计。否则,针对100bp的最小的探针之间的间距和大致覆盖每个登录的全长同时将探针数限制到每个登录10-20的分布过滤探针。探针数没有针对已知的致癌生物受限制,以可能具有所有可得到的Agilent设计的探针的程度产生覆盖这些登录的全体序列的饱和叠瓦组。将微阵列补充预先设计的针对来自人基因组的660个基因和602个基因间区域的aCGH探针,和针对酿酒酵母(Saccharomycescerevisiae)的探针。探针和登录注释中GeneExpressionOmnibus(http://www.ncbi.nlm.nih.gov/geo/)中可获得。样品制备从样品提取总核酸。基因组DNA和/或来自随机引物、逆转录的总RNA的cDNA的全基因组扩增(WGA)使用卖主推荐的方案和输入量用IllustraGenomiPhiv2试剂盒(GEHealthcareBio-Sciences,PittsburghPA,USA)、OvationWGA系统(NuGEN,SanCarlosCA,USA)、和GenomePlex或TransPlex试剂盒(WGA2,WTA2,Sigma-Aldrich,St.LouisMO,USA)进行。扩增产物用QIAquickPCR纯化试剂盒(Qiagen)纯化,和2ug用于SureTagLabeling试剂盒(Agilent)进行的Cy3染料标记。Cy5染料标记对2ug来自AgilentSureTag试剂盒的人参考DNA进行,没有在WGA(实验1,表1)之前或在WGA(所有其它实验)之后,作为对照以报道探针与人(xhh)DNA的交叉杂交。标记的DNA用SureTag试剂盒旋转柱纯化和计算比活性。微阵列产生和处理SurePrint载玻片微阵列(Agilent)用每个载玻片八个平行测定阵列上60,000个特征中合成的60ntDNA寡聚体制造。PathoChipv2a和v2b分别含有60,000个针对独特靶区域或保守加饱和靶区域的探针。PathoChipv3含有37,704个针对独特靶的探针和23,627个用于保守靶或使已知致癌剂饱和的探针。将标记的样品与微阵列杂交,如针对GenomicDNAAnalysis方案(7.2版本,G4410-90010)的AgilentOligonucleotideArray-BasedCGH中所描述的。将含有CGH封闭剂、HI-RPM杂交缓冲剂、和Cot-1DNA(只是先导测定)的总的混合物加入全部标记的测试样品和xhh对照样品的混合物,变性,并与阵列在8-室垫圈载玻片下在65℃伴随20rpm旋转在AgilentHybridizationOven中杂交40小时。阵列使用清洗程序A处理,并在AgilentSureScanG4900DA微阵列扫描仪上扫描。微阵列数据分析扫描的微阵列图象使用Agilent特征提取软件分析以针对每个特征计算平均象素强度和减去局部背景。手动检查图象以记录受高背景、划痕或其它技术误差影响的任何阵列。特征强度分布和通道平衡没有用于质量控制,因为期望大多数特征没有信号,除了针对对照人探针。将针对Cy3和Cy5通道的特征强度输入进PartekGenomicsSuite(PartekInc.,St.LouisMO,USA)。针对共杂交的测试和xhh样品计算人基因间对照探针的特征强度,并测定标度因子,其将使Cy5xhh平均数等于Cy3平均数。然后将针对所有PathoChip探针的Cy5强度乘以标度因子以使染料性能的差异标准化。针对每个探针分别计算Cy3/Cy5比和Cy3-Cy5减法以为双通道或单通道分析管线提供输入。将登录平均数(AccAvg)定义为针对一个登录跨所有探针的平均的Cy3或Cy5强度,并将登录信号(AccSig)定义为AccAvg(Cy3)-AccAvg(Cy5)。如Partek中所执行的Tiling-阵列(MAT)32的基于模型的分析用于针对每个样品的探针信号(Cy3减Cy5)的滑动窗分析。MAT参数是p值截止值0.99、窗口5000bp、阳性探针最小数5、和丢弃0%。候选区域由MAT得分30-300、300-3000、和>3000分类。将所有样品用作测试条件的平行测定,共杂交的xhhDNA平行测定作为对照条件,PartekANOVA工具用于进行具有多个测试校正的配对t检验。在登录水平使用AccAvg(Cy3)对AccAvg(Cy5)和在单个探针水平使用Cy3对Cy5强度值进行比较。将显著性阈值设在加速的假发现率<0.05和倍数差异>2。离群值分析也在登录和探针水平进行通过计算AccSig或探针信号的标准差和针对高于总体平均值两个或更多标准差的任何值过滤来进行。实施例2.微阵列设计PathoChip设计目标是使用多个针对每个物种的基因组中独立靶位的探针,覆盖所有公开的NCBI病毒基因组,和来自对人致病的选择的微生物的序列(图2A)。将产生的序列的收集装配进含有对超过4200个病毒、细菌和真核生物的5206个登录针的44.89千万bp的宏基因组。针对比较基因组杂交应用建立的Agilent定制探针设计算法用于鉴定宏基因组中5百50万个探针,其超过3百万个被预测具有与人基因组序列交叉杂交的低风险。将绘制成独特靶区域的这些探针的亚组在PathoChipv2a微阵列上合成,覆盖至少两个病毒之间序列保守区域的分离的组在PathoChipv2b阵列上合成(图2B)。PathoChipv2b还包括遍及针对已知癌症相关的生物的22个登录长度铺瓦的2085个探针。使用Agilent参考人DNA的先导测定显示对于针对人序列的探针超过750个荧光单位的中间的探针强度,和PathoChipv2a上对于非人特异的探针的大约17个荧光单位和PathoChipv2b上对于非人保守的探针的120荧光单位(表1)。这些测定鉴定6360个荧光>150的探针,其明显地与人DNA杂交,并因此从针对PathoChipv3设计的考虑中去除(图2B)。表1.针对人序列的探针实施例3.针对靶向的物种最佳表现探针的鉴定靶生物——包括嗜肺军团病杆菌、小肠结肠炎耶尔森菌、大肠杆菌、霍乱弧菌、产气荚膜梭菌、肠道沙门氏菌、弗氏志贺菌、和单核细胞增生利斯特菌——在纯培养物中生长,并将每个靶生物2百万个细胞混合进一个原液。含有每个靶1000、100、10或1个细胞的稀释的原液的等分部分用于DNA+RNA提取、扩增、和与PathoChipv3杂交。分析针对每个靶的所有探针以鉴定具有针对嗜肺军团病杆菌、小肠结肠炎耶尔森菌、大肠杆菌、霍乱弧菌、产气荚膜梭菌、肠道沙门氏菌、弗氏志贺菌、和单核细胞增生利斯特菌高灵敏度的探针亚组(图5A-5I)。合计选择的探针以报道针对肠道沙门氏菌、单核细胞增生利斯特菌、弗氏志贺菌、产气荚膜梭菌、小肠结肠炎耶尔森菌、霍乱弧菌、大肠杆菌O157:H7、和嗜肺军团病杆菌中每个的单个检测信号(图6A-6H)。这些结果表示PathoChip能以灵敏度检测多种靶生物的存在。实施例4.在存在人和植物背景DNA+RNA的情况下的测试的测定使用靶生物与人和莴苣细胞的混合物测试PathoChipv3。将稀释的细菌混合物的等分部分与100,000个人细胞和100mg莴苣混合。对照样品只含有人和莴苣细胞。将全部样品体积用于核酸提取。将从每个样品收回的的所有的DNA和RNA扩增、标记和与PathoChipv3杂交。将检测信号计算为针对每个测试样品(实线)和对照样品背景(虚线)的选择的探针总和(图7A)。针对与人和莴苣细胞混合的大肠杆菌O157:H7、嗜肺军团病杆菌、单核细胞增生利斯特菌、肠道沙门氏菌、弗氏志贺菌、霍乱弧菌、和小肠结肠炎耶尔森菌细胞中的每个获得检测信号(图7B-7H。大量宿主细胞背景中的少量病原体细胞可被检测,但是与纯的病原体培养物相比具有较少的绝对信号(参见,图6B-6H)。测试信号和只有宿主的对照信号之间的差异指示检测能力。这些结果指示PathoChip能在存在背景RNA和DNA的情况下以高灵敏度检测多种靶生物的存在。实施例5.在存在食物背景DNA+RNA情况下的测试的测定使用靶生物和多种食物的混合物测试PathoChipv3。靶生物,包括鼠弓形体、霍乱弧菌、小肠结肠炎耶尔森菌、大肠杆菌O157:H7、嗜肺军团病杆菌、肠道沙门氏菌、弗氏志贺菌。将稀释的病原体混合物(每个物种1000或100个细胞)的等分部分与牛奶(图8A-8H)、西红柿(图9A-9H)、或蛤(图10A-10D)混合。对照样品只含有食物。将全部样品体积用于核酸提取。将全部样品体积用于核酸提取。将从每个样品收回的的所有的DNA和RNA扩增、标记和与PathoChipv3杂交。将检测信号计算为针对每个测试样品和对照样品背景的选择的探针总和。这些结果指示PathoChip能以高灵敏度检测食物中多种靶生物的存在。实施例6.患者样品中未知传染因子的检测和鉴定传染病的临床管理中的重要因素在于建立形成该传染的原因的病原体的鉴定。快速和准确的诊断告知治疗选择并对患者结局具有直接影响。PathoChip和与其一起使用的提取方案为检测和分析来自任何类型样品的病原体提供方法,因此克服限制当前的病原体检测程序的挑战。使用PathoChip的患者样品的分析能检测医院病理学实验室不能鉴定的真菌剂。当患者被收入院和呈现感染症状时他病的很厉害。来自患者的脑样品通过查询具有分离自获得的样品的总核酸的PathoChip来分析。PathoChip的60,000个探针的附加分析鉴定与根毛霉菌属的真菌相关的强信号(图11)。产生显示登录分析选择的登录的所有探针杂交信号的热图数据(图12A)。忽视未被检测到或也存在于对照的探针(图13B),留下许多指示真菌杂交信号的探针(图12B)。实际上,提供高登录信号的前2种病原体是微小根毛霉菌株NRRL28626和miehel根毛霉菌(图13)。具有高登录信号的其它病原体是微小根毛霉和喉红酵母属,虽然与前2种病原体相比登录信号实质上较低。由于微小根毛霉菌株NRRL28626和miehel根毛霉菌均具有来自筛选的显著信号,所以这2种剂被鉴定为病原体。有意思地,该真菌的两种不同种能使用PathoChip鉴定和区分,证明该技术的能力。因此,PathoChip显示作为通过鉴定与该类型感染有关的2种相关真菌的临床测定是有用的。基于该诊断,抗真菌治疗计划可针对患者选择。杂交中传染因子的鉴定保守估计在约36小时中实现以防止信号丢失。期望优化的方案可将时间大量减少到24小时内检测并且不长于48小时。该示范清楚地显示PathoChip鉴定患者样品中未知剂的能力,其在较大的大都市医院的临床病理学实验室中甚至是不可能的。其它实施方式从上述描述,显然,对本文描述的发明可进行改变和修改以使其接受多种使用和条件。这样的实施方式也在以下权利要求的范围内。本文变量的任何限定中的元件列表的叙述包括作为任何单个元件或列出的元件的组合(或亚组合)的该变量的限定。本文实施方式的叙述包括作为任何单个实施方式或与任何其它实施方式或其部分组合的实施方式。该说明书中提到的所有的专利、出版物、和登录号以好像每个独立的专利、出版物、和登录号被具体和各自地指出以通过引用被并入的相同程度在本文通过引用被并入。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1