![人类微生物组的衰老标记物和微生物组的衰老时钟的制作方法](http://img.xjishu.com/img/zl/2021/10/29/594m3izmo.jpg)
人类微生物组的衰老标记物和微生物组的衰老时钟
1.交叉引用
2.本专利申请亦要求获得于2018年12月26日提交之美国第62/784,953号专利之优先权,并要求获得于2018年10月26日提交之美国第62/751,397号专利之优先权,其中各项临时申请均通过具体参照于此纳入。
背景技术:3.年龄广为接受的定义有二;第一种定义为实足年龄(ca),仅指某人活着的实际历时。第二种为生物年龄(ba),或称生理年龄,关乎个体的实际生理健康。生物年龄值与身体不同器官和调节系统的性能如何相关,以及在多大程度上维持机体各层面之总体平衡。对体内任何生理过程之测量,一般会通过一组预先定义的生物标志物来完成。生物标志物是作为正常生物过程、致病过程或对治疗干预的药理反应指标而被测量之一种特性。开发生物标志物之目的,在于测量体内非常明确的过程。然而,衰老为系统性的过程,而开发用于测量个体生物衰老之生物标志物,面临着特殊的挑战。事实上,此类生物标志物不仅必须是客观且可量化之物质,加上易测量的生物衰老过程之特征,且亦须能够考虑衰老并非单一的具体过程,而是在多个生理系统中感受到的一套变化。
4.实足年龄与各种有害条件及疾病之风险成正比,如关节炎、心脏衰竭、痴呆、肌肉疏松症等。这些关联发现于多项全人口之研究,并可用于促进特定的保健指南以及对某族群之建议干预。对于仰赖此类研究来制定退休和保健政策之官员而言,按年龄统计的人口学研究势必不可或缺。然而,就个人层面而言,实足年龄的概念倾向于不实用。一个人的预期寿命可能会根据其情况与人口统计学上的估计有相当大的偏差。
5.生物体的生物年龄概念表明,众多线索可汇总为单一的数字分数,比实足年龄更准确地预测老化相关疾病(aad)之风险和预期寿命。在某种意义上,实足年龄和生物年龄为相反的概念。人口中的老化相关疾病风险为实足年龄的函数,而生物年龄为此类风险之一项函数。为了说明此概念,人们往往在估测生物年龄时,试图通过观察其步态、皱纹、皮肤色素和嗓音来推断眼前之人为年迈或年轻。另一方面,确定实足年龄需要核实该人的官方文件(例如出生证明等)。
6.在此之前,为了开发测量生物衰老时钟,已有学者进行几种尝试。基因表达(wolters和schumacher,2013年)及dna甲基化剖析(horvath,2013年)在衰老过程中均会产生变化,并可作为衰老的生物标志物,正如先前以表观遗传时钟所证明。许多分析各种疾病的活体组织转录组的研究表明,患者年龄和性别对基因表达有显著影响(chowers等学者,2003年),小鼠的基因表达随年龄增长有明显变化(weindruch等学者,2002年)(park等学者,2009年),从而开发小鼠衰老基因表达数据库(zahn等学者,2007年)以及针对人类(blalock等学者,2003年)(welle等学者,2003年)(park和prolla,2005年)(hong等学者,2008年)(decurado及church,2009年)开发。尽管有诸多衰老生物标志物,由于同一人的微生物丛在不同时期和不同人之间存在巨大的个体差异,开发基于肠道微生物组的生物标志物已对研究人员带来了挑战。
7.人类肠道由密集的微生物群系落寄存,据计有10
14
颗细胞,比人类机体的细胞数量高一个数量级(suau等学者,1999年)。肠道微生物群系是指特定部位(如肠道)的微生物,为错综复杂的生态系统,在生物体内承载着多种重要功能。微生物群系除了是消化系统的核心要素外,亦具有调节免疫力、处理外来生物、产生重要代谢物,甚至影响高级神经功能(de palma等学者,2017年;rowland等学者,2018年;wu和wu,2012年)。
8.然而,此影响并非单方面。微生物群系并不单单决定某些宿主的特征,而是不断通过多种反馈环路对来自宿主的信号作出反应(lozupone等学者,2012年)。研究发现,这些反馈环路中的某些反映于微生物群系的组成之中。尽管此例显示了明显有害微生物丛的继承,肠道微生物群系生态系统通常在个体的一生中会发生变化。其中一些变化反映了个别的生活方式,而其余变化对整体人口而言似乎更为普遍。
9.元基因组的研究为肠道微生物群系中的微生物丛如何随年龄增长而演进提供了宝贵的见解。此类研究表明,肠道寄存发生于分娩之时,即生存于产道中的细菌。“先锋微生物组”包括兼性需氧菌(埃希氏菌escherichia和肠球菌enterococcus),在哺乳后被专性需氧菌(如婴儿双歧杆菌bifidobacterium infantis)取代(等学者,2017年)。断奶导致另一群落转为更典型的成人微生物群系(tanaka和nakayama,2017年)。这些早期的定植阶段是非常重要的,因正常的婴儿肠道微生物群系可促进肠道粘液的形成、防止病原体的繁殖,以及调节t细胞(buford,2017年)。
10.尽管已有学者对婴儿微生物群系的继承进行了彻底的研究,并可用于评估各种健康状况之风险,然而对于向成人微生物群系的过渡却不明。更重要的是,归因于地理位置、病史、饮食和其他因素的成分变化,使得成人微生物组的分析难以如婴儿的微生物组般富有成效。人类微生物组的年龄相关研究未能产生直接的肠道微生物丛老化理论。某些研究表明,老年人的肠道微生物组生物多样性出现下降(等学者,2017年;hopkins和macfarlane,2002年)。然而,并非所有数据集皆如此,健康老年人的微生物组可能如年轻人般多样化(bian等学者,2017年;maffei等学者,2017年)。其他发现包括特定分类群的变化(如菌株、物种或属或其他分类类别之变化)数量或衰老微生物群系中某种或多种特定微生物(如菌株、物种或属或其他分类类别)在总微生物群系中的百分比变化。如拟杆菌属bacteroides、双歧杆菌属bifidobacterium、布劳特氏菌属blautia、乳杆菌属lactobacilli或瘤胃球菌属ruminococcus在老年人体内显示有所减少,而梭菌clostridium、埃希氏菌escherichia、链球菌streptococci、肠杆菌enterobacteria已被证明在老年人中增加(o'toole和jeffery,2015年;woodmansey等学者,2004年)。然而,这些模式并未严格确定为研究结果,因为不同研究结果可能有显著的不同。
11.到目前为止,生物学家似乎已将肠道微生物组分为三种时间状态:儿童、成人和老年微生物组,三种的划分规则并不明确。其中,成人微生物组是最不确定的术语;它没有像新生儿般确定的继承阶段,且通常不反映老年机体典型的梯度性有害过程。
12.因此,设计出能够根据肠道微生物群系估测出生物年龄之生物钟模型,将是有利的。此外,使用生物钟模型来预测基于肠道微生物群系之生物年龄,会是有利的。此外,若有应用平台允许用户根据其肠道微生物群系和鉴定的生物年龄来获取信息,亦是有利的。
技术实现要素:13.在某些实施方式中,预测实足年龄(例如预测的实足年龄为生物年龄)和(或)表型年龄(例如表型年龄为基于受试者微生物群系之表型生物年龄),基于受试者微生物群系之微生物丛分类学剖析,可包括:从受试者的微生物群系样本中分离出多个微生物核酸;分析多个微生物核酸,以根据多个微生物核酸鉴定微生物群系之微生物数量;根据各微生物的数量生成受试者的微生物群系之分类学剖析;以配置有机器学习平台的计算机处理该微生物群系之分类学剖析(例如机器学习平台包括一个或多个深度神经网络),以预测受试者的年龄和(或)表型年龄;以预测的受试者年龄和(或)表型年龄生成报告;以及向受试者提供报告。
14.这些方法根据计算出的受试者微生物群系的表型年龄来预测受试者之年龄多寡,这导致计算出的表型年龄被用作受试者的预测实足年龄;然而,计算出的表型年龄可能与从受试者的出生日期测得的实际计时年龄有所不同。预测的实足年龄,即表型年龄,在此被称为受试者的生物年龄。因此,受试者的微生物群系预测表型年龄,被确定并定义为受试者的预测生物年龄。因此,基于微生物群系之生物衰老时钟可用于获得受试者的预测生物年龄。因此,预测年龄或表型年龄之参考,会通过对预测生物年龄的探讨来作出。
15.在某些实施方式中,预测受试者生物年龄之方法可包括:根据受试者微生物群系样本中每种微生物之数量获得受试者微生物群系之分类学剖析;以配置有机器学习平台的计算机处理微生物群系之分类学剖析;根据处理后的分类学剖析的输出,预测受试者的生物年龄;生成带有受试者预测生物年龄之报告;以及向受试者提供该报告。在某些方面,该方法可包括:从受试者微生物群系样本中接收多个微生物核酸;以及分析多个微生物核酸,以根据多个微生物核酸确定微生物群系之数量。在某些方面,该方法可以包括根据样本中每种微生物的数量生成受试者微生物群系之分类学剖析。在某些方面,分类学剖析包括本文定义的特定微生物类群,如特定微生物类群包括:类群314;类群95;类群76;类群39;类群41;类群16;延缓衰老类群;早衰类群;或以上类群之结合。在某些方面,特定的微生物类群包括:类群39;或类群41。在某些方面,该方法可包括:接收具有受试者微生物群系之生物样本;以及从受试者微生物群系的样本中分离出多个微生物核酸。
16.在某些实施方式中,该方法可包括导致定义以下某项或多项方式处理微生物群系之分类学剖析:微生物群系中总微生物之相对数量;每种微生物之相对数量;和(或)各种微生物相对数量物种级分类学剖析。在某些方面,该方法可包括基于各种微生物的数量生成受试者微生物群系之物种水平分类学剖析。在某些方面,各分类学剖析是基于整个元基因组读数。
17.在某些实施方式中,该方法可包括:访问具有与多个参考受试者的生物年龄相关联的多个参考微生物分类学剖析的数据库;并将受试者微生物群系的分类学剖析与多个参考微生物分类学剖析进行比较。
18.在某些方面,该方法可包括:确定一种改变的分类学剖析,以将受试者的预测生物年龄降低至比受试者预测生物年龄更年轻的预测生物年龄范围;以及将改变的分类学剖析纳入提供给受试者的报告之中。在某些方面,该方法可包括:鉴定用于获得受试者改变的分类学剖析之处理方法,以获得受试者较低的预测生物年龄范围;以及在报告中提供该处理方法。在某些方面,该方法包括:鉴定出至少一种微生物,其数量变化提供了改变的分类学
剖析,以将受试者的预测生物年龄降低至比受试者预测生物年龄更年轻的预测生物年龄范围;并在报告中提供关于确定的至少一种微生物的信息。
19.在某些实施方式中,该方法可包括:分析来自多名参照受试者的多个微生物核酸,其中对每名参照受试者进行多个微生物核酸之分析;根据多个微生物核酸鉴定每名参照受试者的微生物群系的微生物数量;根据各个微生物数量生成每名参照受试者的微生物群系分类学剖析。以配置有机器学习平台的计算机处理每名参照受试者的微生物群系分类学剖析,以预测每名参照受试者之生物年龄;以及将每名参照受试者的预测生物年龄和相关分类学剖析保存于参考数据库之中,预测的生物年龄与每名参照受试者的微生物群系的分类学剖析相关。在某些方面,该方法包括:生成存储在计算机的有形、非暂时性存储设备上的计算机程序产品,该计算机程序产品在执行时使计算机:访问参考数据库;将受试者的分类学剖析与参考数据库进行比较;提供关于调节与受试者的预测生物年龄相关的至少一种特定微生物之信息;以提供的信息生成报告;并使该报告提供给受试者。
20.在某些实施方式中,该方法可包括:基于分类学剖析创建输入向量;将输入向量输入至机器学习平台;由机器学习平台基于输入向量生成微生物群系的预测生物衰老时钟,其中生物衰老时钟特定于微生物群系;以及准备报告,以将生物衰老时钟包含在内,并确定出基于微生物群系的受试者之预测生物年龄。
21.在某些实施方式中,该方法可包括:向受试者的计算机提供互联网应用;接收来自互联网应用的输入,以获取受试者报告;将生成的报告与受试者相关联;以及向计算机上的互联网应用提供生成的报告。在某些方面,该方法可包括:向互联网应用提供可选取的选择;从互联网应用接收可选取的选择输入,而该可选取的选择输入是从受试者选择可取的选择中获得的;从可取的选择输入中识别关于预测生物年龄的信息;以及向受试者的计算机上的互联网应用提供关于预测生物年龄的信息。在某些实施方式中,该方法可包括以下至少一项:提供有关微生物群系中的微生物类型之信息;提供如何增加微生物群系的特定微生物之饮食信息;提供有关如何减少微生物群系的特定微生物之饮食信息;为微生物群系的参照组提供关于确定的年龄范围的微生物群系之健康信息;提供关于具有类似微生物群系分类学剖析的参照受试者之信息;或为受试者提供多个预测生物年龄的序列,其中该提供是通过互联网向受试者计算机上的互联网应用来提供。
22.在某些实施方式中,创建微生物组衰老时钟的方法可包括:获得多名受试者的微生物群系核酸信息;基于每名受试者的核酸信息确定微生物群系的丰度剖面;以丰度剖面训练多个神经网络模型;评估多项训练的神经网络模型之性能;识别具有低于误差阈值的误差的训练之神经网络模型;将识别的经训练神经网络模型组合为单个集合模型;以及提供该集合模型。在某些方面,该方法可包括:在确定丰度剖面前过滤微生物群系核酸信息;过滤和归一化丰度剖面;以及定义交叉验证数据集;其中,训练使用具有过滤和归一化丰度剖面的交叉验证数据集。
23.在某些实施方式中,评估饮食变化对受试者预测生物年龄的影响之方法可包括:基于受试者微生物群系之第一微生物丛分类学剖析,获得受试者的第一生物年龄,该方法包括:通过改变至少一种物质的摄入量,向受试者提供改变饮食的指导;基于受试者微生物群系之第二微生物丛分类学剖析,获得受试者的第二生物年龄;通过确定第一微生物丛分类学剖析和第二微生物丛分类学剖析间的差异,对第一生物年龄和第二生物年龄进行比
较;确定至少一种微生物的丰度从第一微生物丛分类学剖析至第二微生物丛分类学剖析变化;并提供有关第一生物年龄和第二生物年龄间的差异,以及所确定的至少一种微生物的丰度变化之报告。在某些方面,所述说明包括以下至少一项:提高可增加与单调递增效应有关的微生物的物质的摄入量;提高可增加与单调递减效应有关的微生物物质之摄入量;提高可减少与单调递减效应有关的微生物物质之摄入量;或降低可减少与单调递增效应相关的微生物物质之摄入量。
24.在某些实施方式中,预测受试者身体质量指数(bmi)的方法可包括:根据受试者微生物群系样本中每种微生物之数量,获得受试者微生物群系的分类学剖析;以配置有机器学习平台的计算机处理微生物群系之分类学剖析,该平台使用已知bmi值之分类学剖析数据进行训练;根据处理后的分类学剖析之输出预测受试者的bmi值;生成带有受试者预测bmi值之报告;以及向受试者提供该报告。
25.在某些实施方式中,该方法可包括:基于分类学剖析和相关的bmi值创建输入向量;将输入向量输入到机器学习平台;由机器学习平台基于输入向量生成微生物群系的预测bmi值时钟,其中bmi值时钟是特定于微生物群系的;以及准备报告,以将bmi值时钟包含在内,并识别基于微生物群系的受试者的预测bmi值。
26.在某些实施方式中,预测受试者疾病状态的方法可包括:基于受试者微生物群系样本中各种微生物之数量,获得受试者微生物群系之分类学剖析;以配置有机器学习平台的计算机处理微生物群系之分类学剖析,该机器学习平台用已知疾病状态之分类学剖析数据进行训练;基于处理后的分类学剖析之输出预测受试者的疾病状态;生成带有受试者预测疾病状态之报告;以及向受试者提供该报告。在某些方面,该方法可包括:基于分类学剖析和相关的已知疾病状态创建输入向量;将输入向量输入机器学习平台;由机器学习平台基于输入向量生成微生物群系之预测疾病状态时钟,其中该疾病状态时钟特定于微生物群系;以及撰写报告,以将该疾病状态时钟包含在内,并确定基于微生物群系的受试者之预测疾病状态。在某些方面,已知的疾病状态为i型糖尿病;然而,应当认识到,可使用与其他疾病的疾病状态相关的微生物群系分类学剖析来训练该模型。因此,可使用与疾病类型相关的微生物群系数据为任何类型的疾病训练该模型,其后,受试者可提供其微生物群系核酸进行分析,以确定其是否有确定的疾病状态。
27.在某些实施方式中,生成合成分类学剖析的方法可包括:提供微生物组衰老时钟,该时钟已根据每名受试者的核酸信息,以多名受试者的微生物群系丰度剖析进行了训练;生成至少一项合成分类学剖析;以及为该至少一项合成分类学剖析生成一项报告。在某些方面,该方法可包括:将具有定义的表型的合成受试者的标准输入微生物组衰老时钟;并根据定义的表型为该合成受试者生成合成分类学剖析。
28.上述总结仅为说明性,并非意为以任何方式限制。除了上述说明性的方面、实施方式和特征外,进一步的方面、实施方式和特征将通过参考附图和以下详细描述而明确。
附图说明
29.上述和以下信息以及本揭露声明的其他特征,结合附图来审视,将从以下描述和附录的权利项变得更加充分明显。应当理解,这些附图仅示出了根据本揭露声明的几项实施方式,因此,不应认为是对其范围的限制,将通过使用附图以附加的特征和细节来描述本
揭露声明。
30.图1显示dfs模型中的预测年龄与观察年龄之对照。
31.图2a
‑
2b显示dfs模型(图2a)和xgb模型(图2b)中各年龄组的观察年龄与预测年龄之对照。
32.图3显示用于医疗目的之操作实施方式。
33.图4显示由dfs和xgb年龄预测模型为所有样本(0
‑
90岁)和15
‑
30、30
‑
45、45
‑
60和60
‑
90年龄组分配的74个微生物分类群之重要性等级比较。
34.图5显示由两种机器学习方法进行年龄预测的100个最重要的微生物类群维恩图。
35.图6说明可用于本文所述方法之计算机或计算系统。
36.图7显示用于保险业之操作实施例。
37.图8a
‑
8x显示dfs模型中的24种特征之ale图。
38.图8y显示图8a
‑
8x之计算出的ale值。
39.图9a和9b提供几项使用ale图之说明。
40.图10a和10b显示样本中典型之年龄分布。
41.图11显示为dfs应用测试的神经网络中最佳配置之示意图。
42.图12显示另一组微生物之计算出的ale值。
43.图13显示另一组微生物之计算出的ale值。
44.图14显示构建微生物组衰老时钟之方法。
45.图15包含显示不同受试者通过使用生物钟模型对同一细菌的预测年龄有正面和负面效应之数据。
46.图16a显示预测的平均变化,同时在50岁以上的受试者子样本中转移了微生物之丰度。
47.图16b显示6种微生物对50岁以上的受试者的样本之影响。
48.图17显示bmi值预测的内核密度估计(kde)图。
49.图18显示从存放于ena服务器的公共研究获得的独立样本集之模型性能。
50.图19显示训练可靠的衰老时钟模型,并将累积局部效应(ale)应用于模型,以衡量其对特征值变化的反应。
51.图20提供肠道微生物丛衰老时钟的单调递增和单调递减行为的实施例。
52.图21显示在确定的单调状态下显示出最突出的振幅之41种微生物特征。
53.图22说明可执行本文所述方法的应用程序之实施例。
54.图23包括30个配置文件之实施例,显示配置文件id、实际bmi值、预测bmi值、预测表型年龄和实足年龄。
55.图24包括显示用于“模型2”训练之样本(n=1165名供体)年龄分布之图表。
具体实施方式
56.在以下详细描述,在附图中,除非上下文另有指出,否则类似的符号通常识别类似的部件。在详细描述、附图和申请权利范围中描述的说明性实施方式,并不意味着具有限制性。在不背离本文专利标的之精神或范围之情况下,可以利用其他实施方式,亦可作出其他改变。易为理解的是,本揭露声明的各个方面,如本文一般所描述的,以及图中所说明的,可
以进行安排、替换、组合、分离和设计为各种不同配置,所有这些均为本文明确考虑的。
57.一般而言,本发明涉及人类生物衰老的元基因组生物标志物,其中可包括微生物群系及其微生物组之微生物丛。更具体而言,本发明涉及包括在受试者肠道微生物组剖析中之生物标志物;这些生物标志物可用计算机(如机器学习、人工智能、深度学习、深度神经网络等)进行处理和分析,以便用微生物组衰老时钟提供人类的指标和估计生物年龄(例如,在未知真实年龄之情况下对实足年龄的估计或预测)。更具体而言,根据受试者肠道微生物群系剖析或其他微生物群系位置,为个人生成微生物组衰老时钟,可提供各种用途,如本文所述,包括预测受试者个人的实足年龄或表型年龄(例如生物年龄)。如本文中所用,预测年龄并非真实年龄,而是计算出的表型年龄。微生物群系的表型年龄指的是受试者肠道微生物群系表型所呈现的生物年龄。
58.在某些实施方式中,机器学习和深度学习技术被用来通过元基因组微生物组的剖析来估计人类或其他受试者的生物年龄。机器学习平台可包括一个或多个深度神经网络。
59.在某些方面,机器学习平台会包含一个或多个生成式对抗网络。在某些方面,机器学习平台会包含一个对抗性自动编码器架构。而在某些方面,机器学习平台会包含一项特征重要性分析,用于按其在年龄预测中的重要性对基因、基因组或分类学剖析及其集合进行排序。
60.在某些实施方式中,本发明可用来获取计算基于肠道微生物组剖析或其他微生物群系的微生物组剖析预测之生物年龄(ba),再产生针对生物衰老的干预措施。因此,肠道或其他位置的微生物群系剖析或可用于确定干预措施,以降低个别受试者的衰老。
61.在某些实施方式中,提供了一种根据受试者微生物丛分类学剖析估计其预测的实足年龄(ca)之方法。该方法可评估特定微生物分类群在受试者衰老过程中的重要性。真实的实足年龄可与预测值(如生物年龄)进行比较,以评估受试者之健康状况。
62.在某些实施方式中,该方法可考虑实足年龄和生物年龄。此种实足年龄和生物年龄之混合,可用于生物衰老学中的衰老时钟,如本文所述的生物衰老时钟。在某些方面,生物衰老时钟为一种数学模型,吸收了一系列的衰老生物标志物,如本文定义的特定类群之一,并产生出实足年龄之估测值。生物衰老钟模型可在健康的人身上获得验证(例如经训练),一旦经训练,即可应用于个体,以确定每名受试者之生物年龄。例如,对其生物年龄进行评估者,可为正常的健康人,亦可为通过接受延缓衰老干预措施或患有与衰老相关的疾病之人,预期会有不同年龄。生物衰老时钟模型对健康的人显示出准确的预测,并对改变年龄的情况作出反应,因此被视为估测人类生物年龄之可靠方法,例如为了科学的进步。
63.本文描述提供了一种方法,以鉴定出任何类型的生物数据在衰老方面最重要的特征,其维度有限(如转录组、蛋白质组、生物化学、表观基因组、元基因组)。此种方法可确定哪些特征对生物年龄的估测影响最大,并利用这些维度来设计生物老年学工具和干预措施。
64.尽管受试者通常为人类,但其他哺乳动物,如家禽家畜(如牛、马、鸡、火鸡、猪等)、狗、猫,以及其他种类的动物,如鸟类、爬行动物、昆虫等,亦可作为受试者使用。因此,本发明可用于筛查个别受试者之健康状况,或某些受试者的整体公共健康状况,无论是在共同的地点(如城市),或是有共同的遗产或其他连结基础。接着,鉴定的生物年龄可用于向受试者或受试者群体提供医疗建议。生物年龄也可用于开发消费产品和服务,以有益地影响受
试者的肠道微生物群系。虽可使用肠道微生物群系之微生物丛,亦可使用其他微生物群系之微生物丛,此种微生物群系之位置可包括口腔、皮肤、眼、耳、生殖器、特定器官或肠道以外之其他位置。
65.在某些实施方式中,获取样本之方法可为标准程序。样本可包括肠道微生物组或非肠道微生物组(如泌尿生殖器、皮肤、口腔或其他所列)。其后,可对该样本进行处理,以获得核酸(例如任何形式的dna、rna等)之剖析。此外,亦可使用蛋白质剖析,再对该剖析进行分析,因为核酸或蛋白质通常被分析为数量或百分比或其他价值表示,以描述样本的微生物丛剖析。
66.这些样本可从受试者的任何生物样本中获得,无论是从受试者的表体或从其内部区域取得。例如,肠道元基因组的样本可通过收集粪便或活检获得。相应地,血液样本、尿液样本、汗液样本、毛发样本、粘液样本、精液样本、阴道分泌物样本或其他体液或排泄物样本均可使用。
67.在某些实施方式中,提供了一种根据受试者微生物组分类学剖析来预测其生物年龄之方法。该方法可以包括(a)从受试者的元基因组学之微生物组样本中获得或分离微生物核酸(如任何形式的dna、rna等);(b)确定或估测样本中多种不同微生物(如菌种、物种或属级微生物分类群类别)的相对或绝对数量或百分比或其他数值(如通过使用全基因组测序wgs技术)产生微生物的分类学剖析,如特定微生物群系(如肠道、口腔、皮肤、眼睛、耳朵、生殖器、尿道、肛门、结肠、肠道、阴道、特定器官或其他部位)之微生物群系;以及(c)以机器学习平台处理分类学剖析,以预测受试者(如样本供体)的年龄。预测年龄可以是基于机器学习平台所处理的微生物组分类学剖析的受试者生物年龄。在某些方面,确定的表型或生物年龄可以分配给受试者。在某些方面,可处理样本并获得核酸信息。该方法可通过接收核酸信息,再执行本文所述的计算来操作。
68.本技术和方案通常是针对单个受试者所描述;然而,这些方案可应用于多名受试者,可包括同时评估或以其他方式分析多名受试者的多个分类学剖析或元基因组学剖析。这可包括将不同受试者的剖析相互比较和(或)与标准剖析(例如,具有:(1)比实足年龄低的生物年龄;(2)与实足年龄相同的生物年龄;和(或)(3)比实足年龄高的生物年龄)。接着,所得到的数据可包含在向受试者报告的报告中,这些报告可包括确定建议的饮食计划、治疗计划、生活方式计划、锻炼计划或其他计划。欲降低生物年龄或有此需求的受试者,其后可利用向其报告的一项或多项计划。
69.在某些实施方式中,该方案可包括创建元基因组学生物钟,并利用其预测受试者的生物年龄。基于与受试者实足年龄相关的遗传分析的元基因组学分类学剖析之相关数据,可用于训练计算机模型(例如机器学习和深度学习技术与一个或多个深度神经网络)。该数据可输入到此种计算机模型中,以训练计算机模型将数据与年龄相关联,从而能够接收数据,并将数据与实足年龄和(或)表型年龄相关联。例如,该模型可被如此训练:当某数据集被用于分析时,该模型可根据与某些年龄相匹配的生物标志物和分类学剖析来提供预测年龄的输出。该模型根据分类学剖析输出预测的表型年龄。元基因组学生物钟亦可用于制作保健指南,该指南可基于多名受试者的分类学剖析之集体数据。例如,该方案可包括将数百至数千个元基因组学分类学剖析加载至模型中,以获得关于某人口总体情况之信息、该人口是否比预期年龄高(例如,比实足年龄高)。其后可对此数据进行研究,以确定某些饮
fragilis(41)。在某些方面,本段落的微生物为特定的类群,并用为特定的组合,此处的“类群41”指定了该类群中的41个特定成员。据此,各41种所提及的不同类型的微生物存在于类群41。
73.图21显示41种微生物特征;这些特征显示出最突出的振幅与确定的老年状态。深度训练网络(dnn)模型被训练基于供体的微生物分类剖析来预测其年龄。ale分析(此处所描述)表明,模型中的41种特征可以使预测出的年龄改变0.1岁以上。在这41种特征中,有9种为单调递增(与预测年龄增加有关,最浅色的部分),26种为单调递减(与预测年龄降低有关,最深色的部分),6种并无显示单调行为(例如带有影线的部分)。这41种分类群在某些实施方式中可作为衰老的生物标志物,以减少所有分类微生物群系分析的成本和复杂性。此外,应认识到,其他组的微生物群系亦可进行类似的分析和使用。
74.这些微生物物种可被视为人类年龄的生物标志物,以开发有关衰老性质的假设或设计消费品(如益生菌和益生元),从而对衰老及使用此系列特征的诊断系统产生影响。
75.在某些实施方式中,使用了两种或以上的微生物。在某些方面,仅使用偶数的微生物。在某些方面,仅使用奇数的微生物。在某些方面,使用了五个或更多的微生物。在某些方面,仅使用图4的微生物。在某些方面,仅使用图8a
‑
8y的微生物。在某些方面,仅使用图9a
‑
9b的微生物。
76.使用ale图,如本文中的图表,可估计特定微生物对模型内的预测年龄的影响。其影响随丰度单调上升的微生物在此称为“早衰”,其影响单调下降的微生物称为“延缓衰老”(见图8a
‑
8y)。其他信息提供于此处。在某些情况下,ale是从真实剖析推导出的剖析来进行的,其中推导出来的剖析有一定的改变。
77.在此定义范围内,以下这些物种具延缓衰老:acidaminococcus intestine;bacteroides caccae;bacteroides caecimuris;bifidobacterium catenulatum;bifidobacterium pseudocatenulatum;chryseobacterium gallinarum;desulfovibrio fairfieldensis;dialister pneumosintes;lachnoclostridium sp.yl32;lactobacillus amylovorus;megasphaera elsdenii;ornithobacterium rhinotracheale;oxalobacter formigenes;prevotella jejuni;rhodococcus sp.yl
‑
1;alistipes finegoldii;anaerostipes hadrus;bacteroides dorei;bacteroides ovatus;bacteroides vulgatus;bifidobacterium bifidum;bifidobacterium breve;bifidobacterium longum;blautia hansenii;flavonifractor plautii;methanobrevibacter smithii;odoribacter splanchnicus;parabacteroides distasonis;prevotella intermedia等。在某些方面,本段落的微生物为特定的类群,并用为特定的组合,此处的“延缓衰老类群”指定了该组中具有延缓衰老作用之特定成员。据此,所提及的各个不同类型之微生物存在于延缓衰老类群。
78.在此定义范围内,下列物种属于早衰型:acidaminococcus fermentans;bifidobacterium dentium;enterococcus faecalis;faecalibacterium prausnitzii;hafnia sp.cba7124;lactococcus lactis;parvimonas micra;;pseudomonas aeruginosa;eggerthella lenta;escherichia coli;roseburia hominis;ruminococcus bicirculans;veillonella parvula等。在某些方面,本段落的微生物为特定的类群,并用为特定的组合,此处的“早衰类群”指定了该类群中具有早衰特性的特定成员。据此,所提及
的各个不同类型之微生物存在于早衰类群。
79.本文所述方法使用生物信息,例如关于其一微生物类群之信息。因此,该方法包括获得生物信息。获得生物信息的步骤可包括获得生物样本和处理样本之物理行为(如本文所述或一般已知),以获得生物信息。因此,获取生物信息的方法之实施例可包括:分析多个微生物核酸,以确定宿主生境中的微生物数量;分析有机体的多个核酸,以确定基因组突变的数量和位置;分析有机体的多个核酸,以确定基因转录的强度;分析有机体组织内的多个化学化合物,以确定其浓度;分析有机体组织内的多个细胞类型,以确定其数量。此可以通过从生物样本中获取信息来完成,或可以提供生物信息之数据。其后,分析行动即可执行。
80.在某些实施方式中,衍生的生物标志物被用于近似于具有缩减的特征数量之初始衰老时钟性能。在某些方面,缩减的特征数量被用以评估生物体的健康状态。在某些方面,缩减的特征向量被存储于具有调节访问的数据库。在某些方面,建立于缩减的特征向量的机器学习模型可供专业人士或公众使用,以提供一般的生活方式建议。在某些方面,建立于缩减的特征向量上的机器学习模型被纳入与其他机器学习模型之集合,以提高其在年龄或健康状况预测中之性能。
81.在某些实施方式中,会将单调递增特征与单调递减特征分开处理,以提供与有机体年龄或健康状况相关的两个分数。某些实施方式可能只包括单调递增特征,而另一些实施方式可能仅包括单调递减特征。在某些方面,一个或多个特定特征的单调状态是在用于模型训练的相同样本上所鉴定出;在其他方面,则在外部样本上得出确定。在某些方面,具鉴定的单调状态之特征被用来设计延缓衰老的消费品、饮食计划、干预措施、治疗或其他服务。
82.在某些实施方式中,拥有分类学剖析的过程可包括以计算系统输入和处理单个或多个微生物的各种剖析。例如,处理可包括处理微生物的绝对数量或百分比(例如绝对丰度)、属级剖析(例如定义的菌属中每种微生物的数量或百分比)、微生物的分类群特定基因计数(例如定义的分类群中每种微生物的数量或百分比)、生态群数量或百分比(例如丰度)或其他剖析信息。数据可以任何方式(例如通过因子)被进行处理,以获得处理后的数据,此种处理后的数据可用于分析和预测。例如相对量或绝对量可乘以某系数,并将结果用于方法中。
83.在某些实施方式中,该方法可包括处理生物样本,以提供具有菌株、物种或属的分类学剖析。如此可使剖析特定于不同菌株,在物种水平上具有特异性(例如包括某物种中的所有生物)或在菌属的水平上具有特异性(例如包括某菌属中的所有微生物)。因此,可对数据进行处理,以选择将某分类群用于进行年龄预测,以及(或)将不同分类群相互解析,以便为每个单独的分类群生成单独的剖析。
84.在某些实施方式中,各分类学剖析均基于16s可变区数据。在某些实施方式中,各分类学剖析均基于整个元基因组数据。
85.在某些实施方式中,分类学可被认为是元基因组学剖析。受试者的元基因组学剖析可与参考元基因组学剖析或多个参考元基因组学剖析进行比较。参考的元基因组学资料可以是来自一名受试者或多名受试者之组合。该比较可用于进一步鉴定出该受试者的生物年龄。在某些情况下,可进行比较,以找出产生不同年龄预测的类似微生物组成,以及可调节或改变预测年龄的各种微生物丛变化。此类信息可包含于报告中,例如报告对受试者的
微生物丛分类学剖析之建议改变。
86.在某些实施方式中,该方法可包括获得有关受试者的个人信息,并将其个人信息纳入处理过程,以确定其生物年龄。个人信息可包括个人病史、家庭病史、家庭成员的寿命、受试者曾经或仍患有的疾病或病症类型、家庭成员的疾病或病症类型、受试者和(或)家庭成员的医疗图像、受试者和(或)家庭成员的医疗诊断数据、受试者和(或)家庭成员的当前体重和/或体重历史、受试者和(或)家庭成员的当前身体质量指数、受试者和(或)家庭成员的生物统计学、受试者和(或)家庭成员当前居住的地理位置和(或)居住史、喝酒或吸烟习惯、饮食习惯、运动习惯、其他与健康或生活方式有关的个人数据。家庭成员可为一、二、三、四或五等血亲内之人。在确定生物年龄期间,个人数据可与受试者的元基因组学剖析或参照元基因组学剖析进行比较。鉴于个人数据,该信息可用于探究预测的生物年龄与分类学剖析的数据间的相关性。在多个剖析中进行时,个人数据与预测年龄和分类档案数据之相关性可用于加强预测,以及确定可能导致更高的表型年龄的不健康个人数据,或使用健康的个人数据来设计策略(如治疗、饮食、运动、生活方式等),以降低他人的生物年龄。
87.在某些实施方式中,该方案可包括用于获得分类学剖析的微生物分类群的特定分析,显示特定分类群元基因组学剖析之相对数量或丰度或绝对数量或丰度。因此,相对分析可为特定的分类群相对于受试者剖析中的其他分类群,或相对于另一名受试者或受试者群体中的相同分类群,如平均或平均相对量。绝对数量或丰度可被描述为元基因组剖析中每个分类群之微生物数量。
88.在某些实施方式中,在估测或确定每个分类群的数量或百分比的同时,获得分类学剖析的方案可包括生成受试者微生物群系的相应功能剖析。在某些方面,协议可使用分类学剖析,可包括某特征,即细菌种类。该方案亦可使用相同数据来产生功能剖析,其一特征为某基因家族,可能有助于:(1)表型年龄比实足年龄低;(2)表型年龄与实足年龄相同;和(或)(3)表型年龄比实足年龄高。这些方法可使用功能剖析,经过修改以接受基因数量、丰度或百分比。表型年龄为计算出的生物钟模型之生物年龄。
89.在某些实施方式中,本文所述的协议可包括使用所产生的年龄预测作为表型年龄之测量。因此,表型年龄可与受试者的真实年龄进行比较。当存在差异时,例如表型年龄比实足年龄高,则可实施干预性方案,试图将表型年龄降至实足年龄。此可包括某些治疗,如抗衰老治疗;亦可使用所纳入的参考文献中的治疗方法。当表型年龄低于实足年龄时,可分析受试者的遗传学特征、蛋白质组学特征、健康特征、家庭健康特征、饮食习惯、运动习惯、睡眠习惯、工作习惯以及受试者生活的其他特征,以确定可能导致低于表型年龄(例如较更理想)或高于表型年龄(例如不理想)的参数。接着可将这些参数汇总并提供给表型年龄比实足年龄高的受试者,以便其可尝试实施这些参数,以降低较老的表型年龄,使其表型年龄趋向于实足年龄。因此,具有较年轻表型年龄的健康受试者,可作为健康和行为模式之模型,以便其健康和行为模式可实施于其他受试者,以试图降低表型年龄,使其更趋于或低于实足年龄。
90.在某些实施方式中,方案可执行于数名受试者,如此即可获得多个分类学剖析,并相互比较,这也使得多个分类学剖析可用于识别单个或多个存在于具有以下特征的受试者中的分类群:(1)表型年龄低于实足年龄;(2)表型年龄与实足年龄相同;和(或)(3)表型年龄高于实足年龄。涉及任何一类的分类群均可在整个受试者群体中确定,再作为确定预测
表型年龄之标准。因此,可确定至少一种微生物或微生物群系,其数量或百分比或其他数值(如丰度)之变化可影响受试者的预测年龄。一种或多种微生物的身份可用于识别对获得较低表型年龄有用的微生物,此种微生物可包含于治疗之中,以向具有与实足年龄相同或更高表型年龄的受试者提供此种微生物。因此,归于较低表型年龄的有益微生物可用于治疗。另一方面,被鉴定为有助于较高表型年龄的微生物可用于评估其他受试者的表型年龄,以及通过去除的方式来鉴定出。也就是说,可以使用策略从受试者的微生物群系中去除此类微生物。举例而言,可对微生物进行大规模清除,接着在受试者的微生物群系中建立与较低的表型年龄有关的有益微生物。此外,可用有益的分类学剖析来建立有益的活微生物分组,以建立于受试者微生物群系。若表型年龄高于实足年龄,可向受试者报告关于分类学剖析和其中的微生物信息以及治疗计划。
91.在某些实施方式中,多个分类学剖析可汇编于单个数据库中,该数据库可被汇总或解析为具有剖析的数据库:(1)表型年龄比实足年龄低;(2)表型年龄与实足年龄相同;和(或)(3)表型年龄比实足年龄高。分类学剖析亦可被解析为各种疾病或病症之类别,例如与年龄相关的疾病或病症(例如与表型年龄相关的疾病或病症)。因此,针对特定受试者的方案可包括将受试者的分类学剖析与数据库中的剖析进行比较。此可用于将特定受试者的剖析与参考数据库进行比较,再评估受试者的比较表型年龄和(或)患有与年龄相关的疾病之风险。风险可被计算为具有与疾病或紊乱相关的某分类群特征或分类群特征的概率。关于比较表型年龄和(或)发展年龄相关疾病的风险之信息,可汇编为一份报告,而此信息可向受试者报告。
92.在某些实施方式中,该方案可包括建立参照剖析的数据库,以及这些剖析相应的预测,即实足年龄、表型年龄、或与真实年龄和鉴定的表型年龄间的差异有关的疾病或紊乱状态。该数据库亦可包括每名受试者的健康状态,以及其各种饮食、运动、生活方式或其他行为之信息(例如个人数据)。
93.在某些实施方式中,该方案可包括建立可用于将受试者的微生物分类学剖析与参照数据库进行比较的软件。此可包括创建可接收受试者微生物分类学资料之软件,并将其与一名或多名其他受试者的微生物分类学资料进行比较。具有可比性和相似性的资料可用于确定参照的年龄或其平均值,并使用此年龄或平均年龄来预测受试者的表型年龄。该软件亦可用于提供关于特定微生物对个体年龄预测的影响之信息,而这些信息可汇编为一份报告,并向受试者报告。
94.在某些情况下,数据库(例如具有微生物分类学剖析之数据库),无论是否与表型年龄相关,均可配置为区块链存储系统。区块链存储系统可用于跟踪一名或多名受试者的微生物分类学剖析进展(例如随时间变化的进展)。区块链存储系统可用于跟踪鉴于微生物分类学剖析进展的预测表型年龄。
95.在某些情况下,协议可包括只在有或未有与分类学剖析相关联的时间年龄上训练年龄预测时钟(例如模型、机器学习平台)。此外,在有更多个人数据之情况下,协议可转移方法来制作表型衰老时钟。表型年龄可作为一种措施提供给受试者,以告知其患有与衰老有关的疾病之风险。在某些情况下,该协议不评估计时年龄,仅评估表型年龄,反之亦然。
96.在某些实施方式中,数据库和报告可包含有关至少一种可调节年龄预测的特定微生物之信息。该微生物可提高或减少年龄预测值。如此一种或多种微生物可被识别而出,用
于分析分类学剖析,以确定预测的年龄。如此一种或多种微生物的存在、不存在或数量,可利于将受试者的分类学剖析与表型年龄估计或预测值相联系。
97.在某些实施方式中,该方案可包括确定受试者的饮食计划,该计划可导致表型年龄低于或相等于实足年龄。在某些方面,降低表型年龄的饮食计划可来自另一表型年龄低于当前受试者的饮食计划。具有较低表型年龄的受试者的饮食计划可应用于具有较高表型年龄的受试者,以试图降低该受试者的表型年龄。在某些情况下,可汇编和分析多名具有较低表型年龄的受试者之饮食计划,以确定在具有较低表型年龄的高比例受试者中一致的特征,接着可确定此种降低表型饮食计划的特征。其后,可将确知的降低表型的饮食计划之特征应用于具有较高表型年龄的受试者。因此,富有成效的饮食计划可用于其他有需要的受试者之疗程。
98.在某些方面,该方案可包括针对支持或抑制特定微生物来建立饮食计划,这些微生物的数量、百分比或丰度的变化可影响预测的年龄,例如降低表型年龄。在创建饮食计划后,可包含于一份报告中,再提供给需要降低表型年龄的受试者。另外,创建的饮食计划可作为治疗饮食计划实施于需要降低表型年龄的受试者。
99.在一些实施方式中,方法可包括根据受试者的分类学剖析为其生成建议疗法。此可包括确定元基因组学剖析和(或)年龄预测(例如表型年龄),其后可用于确定建议疗法。建议疗法可包括传统的药物疗法,如通过施用治疗剂(如药物、疫苗等),以及将受试者的微生物群系改变为健康的微生物群系疗法,该疗法已被鉴定出与年轻的表型年龄相关联。微生物群系的改变可包括清洗微生物群系,以去除某些微生物或所有微生物,并用选定的微生物或与年轻表型年龄相关的分类学微生物剖析来补充微生物群系。该方案可包括将受试者的元基因组学剖析和年龄预测与参考元基因组学剖析进行比较、确定疗法、生成关于所确定疗法的报告,并向该受试者提供报告。
100.在某些实施方式中,方案可包括分析关于至少一种特定微生物对年龄预测的影响之信息。其后,该方案可包括创建微生物丛疗法,例如使受试者的微生物丛趋向相似于具有年轻表型者的健康微生物丛。为了随时间推移改变年龄预测,可实施微生物群系疗法。因此,确定的微生物可用于开发此种微生物丛疗法,并向一名受试者以及人口中的多名受试者提供微生物丛疗法。深度特征合成(dfs)模型或极限梯度提升(xgb)模型可用于定义有益微生物(例如导致表型年龄较轻)和(或)有害微生物(例如导致表型年龄较高)。这些有益微生物可包含于应用于受试者的疗法或治疗中,以增加此种有益微生物之数量、丰度或百分比。其后,有害微生物可成为选择性清除的目标,或可能在发现有害微生物时进行一般微生物清除。其后,可使用有益微生物将微生物群系恢复至有益状态。
101.在某些实施方式中,可根据分类学剖析以及相关的预测表型年龄来设计消费品。该方案允许模型估计某些微生物对老化过程引起的影响。一些饮食产品可专门设计为以理想方式改变肠道微生物丛之组成,如提高预测的表型年龄。消费品可以是个性化的,亦可根据人口中微生物群系年龄进展的一般模式来设计,以达到较轻的预测表型年龄。被确定为与较老的预测表型年龄相关的微生物,可被特别排除于消费品之外。尽管此项技术以人类肠道微生物组为重点进行描述,然而此处披露的相同方法亦可应用于其他人类栖息地或其他类型之动物,以获得类似结果。这些分类学剖析和预测的表型年龄可用于设计大量的消费品,此类消费品旨在改变相应的微生物群系,其中消费品的一些例子可包括衣物、体味阻
隔剂、内衣、牙膏和口腔护理产品,以及诸多其他产品。此外,非人类消费品亦可根据年龄预测和标记集的推导来设计。例如,此类方法亦可应用于修改牛的饲料添加剂。
102.确定的有益微生物和确定的有害微生物可用于开发消费品、制造品、任何物质或任何可作为提供给消费者的物品,这些微生物可用于增加受试者的微生物群系中的有益微生物。这些这些微生物亦可用于降低受试者的微生物群系中的有害微生物。这些微生物亦可用于在受试者的微生物群系中建立有益的微生物分类学剖析系。在某种程度上,设计消费品可基于概括参照数据库中的分类学剖析信息,再将商品交付给消费者,用于:增加受试者微生物群系中的有益微生物;减少受试者微生物群系中的有害微生物;或在受试者的微生物群系中建立有益的微生物分类学剖析。商品的几个例子可以是化妆品、饮食产品、医疗产品、衣服、仪器、糖果或类似物品。商品可包括有益微生物、促进健康的物质、有益微生物依赖的物质(如维生素a、b、c、d等)或类似物质。
103.在某些实施方式中,有关确定的有益微生物和有害微生物以及有益微生物分类学剖析之信息,可用于创造化妆品产品,以支持或抑制其数量、百分比、丰度或其他参数的变化会影响年龄预测(例如使年龄预测值较低)之特定微生物。化妆品可交付给受试者并由受试者使用。化妆品可包括化妆品、睫毛膏、粉底、唇彩、眼影、眼线、润唇膏、底妆、腮红、口红、指甲油、遮瑕膏、粉饼、古铜器、荧光笔、唇彩、唇线、洗发水、护发素、头发造型组合、染发剂、光泽精华、油膏、保湿剂、清洁剂、抗衰老霜、去角质剂、眼药水、瑕疵控制组合物。痤疮控制成分、卸妆剂、爽肤水、收敛剂、口腔护理成分、晚霜、晒肤剂、防晒霜、牙膏、丰唇剂、身体乳液、香水、沐浴露、止汗剂、除臭剂、肥皂、脱毛成分、防晒护理成分、身体磨砂膏、浴盐、浴液、芳香疗法、脂肪团治疗、减疤剂、护肤粉等等。
104.在某些实施方式中,关于确定的有益微生物和有害微生物以及有益微生物分类学剖析之信息,可用于创建饮食产品,旨在支持或抑制其丰度变化将影响年龄预测(例如使年龄预测值更年轻)的特定微生物。饮食产品可被交付给受试者并由受试者使用。饮食产品可以为任何可食用的物品,如食物、饮料、补充剂、粉末、药丸、胶囊或其他物品。
105.在某些实施方式中,关于确定的有益微生物和有害微生物以及有益微生物分类学剖析之信息,可用于创建医疗产品,旨在支持或抑制其丰度变化将影响年龄预测(例如使年龄预测更年轻)的特定微生物。该医疗产品可交付给受试者并由受试者使用。医疗产品可包括用于受试者体内的产品(如导管、支架、过滤器、针头、植入物等)或用于受试者体外的产品(如绷带、支架、石膏等)。
106.在某些实施方式中,关于确定的有益微生物和有害微生物以及有益微生物分类学剖析之信息,可用于创建旨在支持或抑制特定微生物之衣物,这些微生物丰度的变化将影响年龄预测(例如使年龄预测更年轻)。这类衣物可交付给受试者并由受试者使用。衣服可为受试者穿戴之任何物品,如内衣、胸罩、裤子、短裤、衬衫、帽子、手套、袜子或类似物品。
107.在某些实施方式中,确定保险费率之方法可将预测的表型年龄以及分类学剖析考虑在内。保险业的方法可允许保险公司估计出更精准代表预测表型年龄的费率。将客户置于比其实际所处的年龄段(如较高的预测年龄)预测提供了一个信号,即对方可能具有影响预期寿命或疾病风险的隐藏条件,从而影响预定的保险费率。例如,肠道微生物丛与某些健康问题之关联,并将年龄预测作为人类表型年龄之一般标记,保险代理人可评估未来赔付事件之可能性。例如,若某健康的30岁男性欲购买一份人寿保险,然而其微生物群系属于较
典型的60岁者,代理人可在老年人的参照数据库中查出患有心脏疾病的风险,并通过在其他标准中增加此年龄预测的权重来考虑此风险。另一方面,若某60岁之人提供的资料被预测为更年轻,该客户则可能享有折扣。
108.在某些实施方式中,为了获得保险单的折扣,投保人可能愿意或被要求提供其微生物分类学剖析,以及由本发明确定之预测表型年龄。
109.在某些实施方式中,为了追踪受试者表型年龄或其分类学剖析,可实施区块链解决方案。不可变和防篡改的区块链数据库将允许保险代理人轻松请求数据,并允许客户控制何人可访问其个人数据。
110.在某些实施方式中,预测的表型年龄可用于确定受试者的保单。因此,保险方法可被配置为考虑预测的表型年龄,以便在预测的表型年龄高于阈值或实足年龄时增加保单成本。此外,保险方法可以被配置为考虑预测的表型年龄,以便在预测的表型年龄低于阈值或实足年龄时降低保单成本。相应地,保险方法可包括鉴于参照数据库中的元基因组学微生物分类学剖析,在分析受试者的元基因组学微生物分类学剖析的基础上制定保单。至少部分基于元基因组学微生物分类学剖析的保单可交付至保险客户。在某些情况下,保单持有人的支付率受到从其微生物分类学剖析得出的年龄预测之影响,如本文所述。在某些情况下,要求保单持有人向保险商提供其经验证的生物分类学剖析之动态及相应的年龄预测,以进行分析。
111.在某些实施方式中,可执行一种用于创建预测性计算机模型之方法,可对一名或多名受试者的微生物分类学剖析进行分析,再提供预测的表型年龄。该方案可包括分析聚集的数据(例如微生物分类学剖析和(或)预测的表型年龄),以产生用于创建硅基微生物组群落之生成模型。硅基微生物组群落可被配置为难以与真实的参照数据库进行区分。因此,可利用硅体微生物组群落代替真实的参照数据库。这可使年龄预测方法使用模拟数据,如硅基微生物组群落,而非真实受试者之真实数据。
112.在某些实施方式中,生成合成分类学剖析的方法可包括:提供微生物组衰老时钟,该时钟已根据每名受试者的核酸信息,用多名受试者的微生物群系之丰度剖析进行了训练;生成至少一份合成分类学剖析;以及为该至少一份合成分类学剖析生成一份报告。在某些方面,该方法可包括:将标准输入至具有定义表型的合成受试者之微生物衰老时钟;并基于定义的表型为合成受试者生成合成分类学剖析。例如,生成模型可用于创建合成的微生物群系合成的(例如计算机所模拟)微生物组群落或分类学剖析。也就是说,一旦得出微生物衰老时钟,即可将其用于为非真实受试者的合成受试者生成合成微生物群组群落,或合成分类学剖析。如此为非真实受试者提供了预测性信息。在一实施例中,可用参数输入微生物组衰老时钟,以获得输入参数的合成微生物组群落或合成分类学剖析,其中输入参数可包括诸如健康状况、体重、性别、年龄、任何疾病、任何伤害或其他类似信息。在一实施例中,输入可包括一名患有糖尿病的21岁男性之信息,而微生物组学衰老时钟可为此患有糖尿病的21岁男性提供预测,或一个或多个合成微生物组群落或合成分类学剖析的例子。因此,基于非真实受试者的输入信息,可生成合成微生物组群落或合成分类学剖析。
113.在某些实施方式中,如使用预测性计算机模型之方案,可产生预测的表型年龄。如此预测年龄可作为数值提供。此外,如此预测年龄在根据受试者的微生物分类学剖析预测其年龄时,可以达到若干年、月和(或)日之平均绝对误差。如此对表型年龄之预测,可用于
法医方法、医疗方法和科学目的。
114.为了防止个人信息之泄露,受试者可使用其个人签名密钥以非对称算法对其样本进行数字签名。这使得密钥持有者可证明其微生物特征和相应的年龄预测之真实性,而不必在存储中提及其数字身份。此外,专家设施亦可签署配置文件和预测哈希值,以验证数据采集和分析均由其进行。
115.为了分散数据分析、防止专家设施的数据关联和积累,wgs机器可被连接到分散的计算系统。举例而言:某测序仪在不拥有任何关于受试者的信息之情况下进行测序,然而其接收受试者的数字签名,并在内存中保存签名——测序关联。它将输出和签名反馈给某分散的计算系统,在此系统,数据经过质量控制、分选和预测算法,由其所有代理共享。此类允许通过不包括的范围进行安全的远程计算之系统,保证了代理无法访问其所分析的数据。某受试者可能需要事先与计算系统分享其公钥及通往分散存储位置之签名路径,以便成为唯一可被授予访问输出之人。计算系统检查其输入的签名,并将输出重定向到某指定的位置。如此一来,元基因组剖析和预测仅受试者可使用:专家设施进行测序,但不接收任何输出,而计算网络代理在设计上无法访问测序数据,最终的输出被储存于受试者指定的位置。为了验证所有处理步骤之合法性,此管道中的每名参与者均会在输出哈希值上留下个人的签名。
116.在某些实施方式中,在受试者收到数据后,对方可以与某实体(例如与保险单供应商)分享,该实体将能够通过检查处理过程中积累的签名来查验预测的真实性。
117.目前的模型可通过机器学习获得。
118.本发明可将数种机器学习方法适应于年龄预测。机器学习问题的目标为典型的监督性回归,可对细菌分类群特征作为输入变量进行模型训练。
119.用于训练机器学习算法的数据可被修改为仅包含可靠的检测特征(>1e
‑
5丰度)。例如,去除不存在或缺失的年龄值后的数据规模,可以为来自约621人的约3,058条记录。每条记录可包含1,673个细菌特征。目标变量可包括7岁至90岁范围内的年龄。例如,年龄分布可描述于图10a
‑
10b。
120.这些模型可通过各种协议进行评估。
121.模型可通过五重交叉验证和网格或随机搜索策略进行训练,以补偿过度拟合。由于数据集的规模相当适中,并无引入外部测试集。相反的是,给定的指标可作为每等分对应的5个测试集的预测得出,从而得到完全预测的输入数据集。所有模型均可用相同的折分法进行评估,以进行公平的比较。在所有评估中,可以测量以下指标。
122.决定系数(r2)定义为:
[0123][0124]
[0125][0126]
而为数据集中的平均年龄,c
i
为样本i的分类学剖析。
[0127]
平均绝对值(mae)可定义为:
[0128][0129]
而c
i
为来自样本i的分类学剖析。
[0130]
皮尔逊的相关系数(r)可定义为:
[0131][0132]
其中n为样本数,而为平均预测或观测年龄。
[0133]
r2指标可被选择作为性能比较的目标指标。不同模型及其配置的性能可根据目标指标在整个预测数据集上进行比较。
[0134]
在某些实施方式中,该模型可被配置为神经网络配置,可为深度特征选择(dfs)模型。在不同神经网络模型的选择之间,dfs可用于本文所述的方法,原因至少有两:首先,dfs模型旨在识别最重要的特征,这对特征解释而言是必要的。其次,dfs模型意味着一种深度架构,对高维数据的预测任务显示出最佳效果。dfs模型的主要构想为在输入层和mlp的第一个隐藏层之间增加稀疏的一对一的线性层。dfs模型的目标定义为:
[0135][0136]
最终模型的结构可通过调整以下超参数得出:层数与每层内的神经元数量,非线性的类型(relu、prelu、elu、leakyrelu),学习率(0.001、0.005、0.001)。adam可以作为优化器使用,可使用比率为0.5的丢弃(dropout)技术来减少过度拟合。对于具有2和3个隐藏层的架构,可采用批量归一化技术。
[0137]
在某些实施方式中,可进行特征分析。为了确定对年龄预测重要的细菌分类群(如一个以上的分类群),现行的方案可采用以下技术:包络特征重要性(pfi)和累积局部效应(ale)。
[0138]
在某些情况下,可以使用pfi法。该方法通过测量特征列互换前后的目标指标(r2)来计算年龄预测中特征的相对重要性值。其基本假设是,与原先预测相比,重要特征的互换会导致预测精度的降低。另一方面,非重要特征的随机置换不应在很大程度上影响预测。由于造成随机置换的偏差,每个特征的重要性分数可在k次置换的结果中取平均值。所有显著性分数可以为五个所有已训练的模型中进行计算,随后进行平均,以避免过拟合的偏差倾向。
[0139][0140]
其中,s
original
为目标指标得分,s
shuffled
(k)为预测后的目标指标,为控制每个特征的排列数量之引导参数。目标度量可选择r2度量。
[0141]
亦可使用ale法。ale法通过测量特定特征对年龄预测的影响,即预测在特征值发生微小变化时的平均变化。ale图通过首先计算每个四分位数的局部效应(le)(ale方程式1)来组合:
[0142][0143]
(ale方程式1);
[0144]
其中,n
q
为目标特征的第q个和(q
‑
1)个量级之间的样本数;c
j
为属于该区间的样本j的丰度向量;f(c
j
、q)为该向量的预测年龄,其中特征的第q个量级值被替换为目标特征值。
[0145]
为了产生ale,le被相加(ale方程式2):
[0146]
ale1=le1[0147]
ale
q
=le
q
+ale
q
‑1[0148]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(ale方程式2)
[0149]
此外,ale是居中的,因此某特征的所有ale之和为零。
[0150]
在某些实施方式中,可使用梯度来提升分类器。为了验证所选择的标记特征集,基于96个特征(95个来自表5中的标记集和第96个,相等于所有其他微生物丰度)训练梯度提升分类器。数据集可以分为训练集和测试集,训练集包含所有个体的75%。所有样本可分为三组:年轻(15到40岁)、中年(41到60岁)和老年(61到90岁)个体。该分类器可使用python scikit的标准gradientboostingclassifier类来实现,设置如下。{'n_estimators':100,'max_depth':4,'min_samples_split':4,'learning_rate':0.2,'loss':'deviance'}。表3显示了一对一设置的预测质量指标,而表4显示的是随机分类器的质量。在此简单的设置中,所披露的标记列表提供了比随机多25%的优势。
[0151]
在某些实施方式中,预测某有机体年龄的方法可包括基于神经网络、梯度提升、随机森林的模型。
[0152]
图1显示了dfs模型中的预测年龄与观察年龄之对比。因此,图1说明使用本发明实施方式得出的年龄预测。利用深度特征选择(dfs)管道,在5倍90
‑
10%交叉验证的情况下,对3,058个微生物组样本(621人)进行了年龄预测。微生物组剖析来自开放性项目,可在ena和sra档案馆获得(项目编号:erp019502、erp009422、srp002163、erp004605、erp002469、erp008729和erp005534)该实施方式的总体准确性使本发明得以预测某人的年龄,平均绝对误差(mae)为2.83岁。
[0153]
图2a
‑
2b显示了dfs模型(图2a)和xgb模型(图2b)中各年龄组的观察年龄和预测年龄。mae为平均绝对误差,n为每个年龄组的样本数。因此,图2a
‑
2b提供了更详细的观察例dfs(图2a)和xgb(图2b)实施方式之准确性。预测误差在不同年龄组中的分布是不均匀的,
30
‑
60岁者的预测误差最低。
[0154]
表1显示了dfs和xgb模型中pfi重要性、流行率和平均丰度。该模型可称为模型1。因此,表1提供了关于拟议的微生物标记集之信息。xgb和dfs重要性栏位显示了根据pfi方法对相应特征进行互换后r2质量指标的下降(五等分的平均值)。流行率栏显示了可靠检测到该特征的样本部分(细胞数>10个/百万),丰度栏显示了在检测到该特征的肠道群落中微生物的平均相对数量。
[0155]
表1:
[0156]
[0157]
[0158]
[0159]
[0160][0161]
在某些方面,表1的微生物为特定的类群,并作为特定的组合使用,此处的“类群95”,如上定义,指定了该微生物群系中的95个特定成员。据此,各95种所提及的不同类型的微生物存在于类群95。
[0162]
图3显示用于医疗目的之实施方式。尤其,图3显示几项操作实施例之方案,这些方案可由医疗专业人士使用。经典的元基因组学方法可用于产生某个体肠道微生物丛分类学剖析,或在该个体之另一微生物群系中。随后使用本发明对该剖析进行分析,以确定供体的微生物丛是否显示出加速老化的迹象。若本发明衍生的元基因组时钟显示其微生物群系为典型明显衰老之人,则软件可准确指出造成此效应的具体改变。随后,医疗专业人员可评估此一信息(结合个人数据),以提供生活方式建议,为病人选择更好的治疗方法,或为其规划一种饮食,以支持“延缓衰老”(例如有益、与表型年轻相关)之微生物,并抑制肠道或其他方
面的“早衰性”(例如有害、或与表型年长相关)之微生物。
[0163]
图4显示由dfs和xgb年龄预测模型为所有样本(0
‑
90岁)和15
‑
30岁、30
‑
45岁、45
‑
60岁和60
‑
90岁年龄组分配的74种微生物分类群之重要性等级比较。因此,图4说明了对于各年龄组中的准确年龄预测而言,最重要的微生物,如由两种年龄预测模型(xgb和dfs)得出的pfi分数所示。pfi分数为特征互换后r2的下降,分数越高的特征对模型性能越重要。对15
‑
30岁、30
‑
45岁、45
‑
60岁和60
‑
90岁年龄组样本以及所有样本(0
‑
90岁)进行准确预测的20种最重要的特征被结合起来,形成76种特征之列表。将其在各组中的pfi得分等级绘制在热图上(黑色对应最重要的特征),行(一个模型和年龄组内一个特征的重要性向量)和列根据曼哈顿距离重新排序,以显示相似性。xgb和dfs模型的特征重要性高度相似,然而两者在对不同年龄组进行预测时,依赖不同的特征。
[0164]
表2显示与图4各数字标识符相关的名称。
[0165]
[0166]
[0167]
[0168][0169]
在某些方面,表2的微生物为特定的类群,并作为特定的组合使用,此处的“类群76”,如上定义,指定了该微生物类群中的76个特定成员。据此,各76种所提及的不同类型的微生物存在于类群76。
[0170]
图5显示了两种机器学习方法对年龄预测的100种最重要的微生物分类群的维恩图。据此,图5说明了由pfi衡量的各年龄组中100种最重要的特征之间的重叠情况。括号内的整数表示xgb衍生特征的重叠,非括号内的整数则表示dfs衍生特征的重叠。在这两个模型中,所有年龄组的100个最重要特征列表中均可发现40至41种特征,并无任何年龄组在如此列表中具有多于18种独特的特征。
[0171]
图7显示了应用于保险业的操作实施例。因此,图7显示了本发明应用于保险业实施方案的简化方案。基于肠道微生物组或其他微生物群系之年龄预测,可由保单提供者向潜在的保单持有人提出要求,以修改保险单合同的条款。其后,保单持有人前往指定之机构,该机构使用本文规定的方法和(或)标记物进行微生物组筛查和解释。其后,测试结果被储存于具有启用的智能合约之不可变的存储器上,任何拥有样本供体id之人均可访问。通
过分享id,供体允许保单提供商检查其肠道微生物丛(或其他微生物群系)水平或进展情况(例如随时间的推移)和相应的年龄预测。这些信息再由保单提供商纳入计算寿险折扣的因素,或由第三方纳入评估可行的结算费用。然而,任何类型的保险提供商均可使用本实施方法。此外,此实施方法亦可针对任何行业进行修改,如医疗或有合同的服务和商品。保单提供商可替换为任何类型的合同管理者,可根据预测的生物年龄(即生物钟模型之结果)进行修改,其一或一系列的结果可用于订立或修改任何商品或服务之合同。
[0172]
表3显示了梯度提升分类器的性能。因此,表3说明了本文提供的指定标记列表的预测能力。梯度提升分类器在75%的可用数据上进行训练,并在842个样本上进行测试,仅使用95个(共1,673个之中的)微生物分类群之相对丰度。质量指标的计算与一对多算法的设置相同。tp代表真递增(正确分配至该年龄组的数量),fp代表假递增(错误分配至该组的数量),fn代表假递减(属于该组但分配至另一组的样本数量),tn代表真递减(正确未分配到该组的样本数量)。精确度等于tp/(tp+fp)(衡量所有分配中正确分配到该组的部分),失误等于fn/(fn+tp)(衡量本应分配到该组的测试样本,但被分配到另一组的部分),准确度等于(tp+tn)/(样本数)(衡量在一比多的情况下所有样本中正确分配的数量)。p值被定义为预测向量排列的部分,其准确性优于观察到的准确性。在10'000次迭代中,没有任何如此排列组合能提供更好的准确性。
[0173]
表4显示了样本在年龄组中的随机(等价)分配。因此,表4为表3提供了参考框架。这些指标来自于对每个年龄组样本的等比分配。p值被计算为原始预测向量的排列组合之数量,这些排列组合提供了比等比分配更好的准确性。某些随机的排列组合提供了更好的分类精度,这表明梯度提升模型(表3)的表现明显优于等比分配。
[0174]
表3
[0175]
[0176][0177]
表4
[0178]
年龄组15
‑
3031
‑
6061
‑
90总数样本数378265199842tp1349868 fp144189211 fn244167131 tn320390432 精准0.480.340.24 漏报0.650.630.66 准确0.540.580.59 p
‑
值<0.0001<0.0001<0.0001 [0179]
图8a
‑
8x显示了dfs模型中24种特征的ale图。图8y显示了图8a
‑
8x的计算ale值。因此,图8a
‑
8x包含了从dfs模型中100种最重要的特征中挑选的24种特征的ale图。x轴显示某种微生物的相对丰度,y轴显示以年为单位的累积局部效应(ale)之变化。ale显示预测在增加目标特征时的平均变化。点代表特征分布的量级(ale为以5%的增量计算1%到95%的量级)。ale仅根据目标特征值非为零的样本计算。在某些方面,本段落和图8a
‑
8x所示的微生物为特定的类群,并作为特定的组合,此里的“类群24”指定了该类群中的24个特定成员。据此,各24种所提及的不同类型的微生物存在于类群24。
[0180]
图12显示了另一组微生物的计算ale值。在某些方面,本段的微生物为特定的类群,并作为特定的组合使用,本处的“类群19”为该类群中的19个特定成员。据此,上列各19种不同类型的微生物存在于类群19。
[0181]
图13显示了另一组微生物的计算ale值。在某些方面,本段的微生物为特定的类群,并作为特定的组合使用,本处的“类群13”为该类群中的13个特定成员。据此,上列各13种不同类型的微生物存在于类群13。
[0182]
图9a和9b提供几项使用ale图之指示。据此,图9a和9b包括解释ale图之视觉指示。
图9a为潜在的延缓衰老微生物之例子,其丰度的增加与预测年龄的降低有关。图9b为潜在的早衰微生物,其丰度的增加平均产生较高的预测值。在此特定的例子中,[eubacterium]halii丰度增加了0.8%,导致预测年龄平均增加了0.57岁。
[0183]
图10a和10b显示样本中示例性的年龄分布。因此,图10a和10b说明了用于模型训练的数据在样本(图10a)和个体(图10b)层面的年龄分布。
[0184]
图11显示dfs的应用经测试的神经网络之中最佳配置的示意图。因此,图11包括在经测试的神经网络之中用于dfs应用的最佳配置之示意图。共有3个隐藏层,每个隐藏层有512个神经元,利用prelu激活函数,设置为0.001的学习率。“x”为特征的输入向量(即微生物物种相对丰度)。
[0185]
在某些实施方式中,提供了用于收集微生物丛材料和随后进行元基因组测序之试剂盒,目的为评估受试者(例如样本供体)之表型年龄。此种试剂盒可包括采用基于人类微生物群系(例如肠道微生物群系)元基因组测序协议之说明。该试剂盒亦可包括所披露微生物标记集之核酸。该试剂盒可包括在样本制备、测序平台和策略以及质量控制措施、归一化技术、分类学分配和丰度计算算法方面可能有所不同的指导方案。
[0186]
在某些实施方法中,本文所述方法之应用可用于评估其他依赖实足年龄之有机体属性,其中计算出的生物年龄与实足年龄相比之差异,被用于确定疾病状态之存在。举例而言,此类方法可用于估计与衰老有关的疾病或疾患风险,或根据预测的表型年龄提供医疗建议。
[0187]
在某些实施方式中,这些方法可使用整套已揭露的微生物标记,以及对其子集或由所述标记组成的高阶分类群的集合。举例而言,某些操作的实施方式可利用基于扩增子的测序技术,该技术虽无提供物种水平的分辨率,但可用于评估属级的微生物群系落剖析。
[0188]
在某些实施方式中,本发明可用于医疗目的。因此,本发明可包括利用所公开的一套标记微生物的试剂盒和管道,以提供有关生活作息和饮食以及其他因素之建议,如疗法或生活作息或饮食的改变。本发明可帮助医疗专业人员根据病人微生物群系(如肠道微生物群系)组成、或由此产生的功能能力来选择药物、疗法或饮食干预措施。
[0189]
在某些实施方式中,专门的数据库、咨询软件、对现有病患识别证系统的扩展、保健指南、试剂盒和管道(以及利用这些的实验室)均可在所公开的标记集和本文描述的方法之帮助下,得出基于年龄之测量。
[0190]
在某些实施方式中,微生物标记物和方法可用于法医背景,以验证或确定某人的身份。法医实施方式可包括(但不限于)具法律效力的认证系统、专家证人机构,以及提供基于元基因组的年龄验证的实验室。所有这些实施方式均可利用上述方案,以利用某人的微生物群系(例如肠道)元基因组中所含的信息。
[0191]
在某些实施方式中,微生物标记物和方法可在科学背景下使用,以衡量新型疗法之有效性。举例而言,在具延缓衰老特性的合物筛选研究中,肠道微生物群系衍生的年龄变化可用于帮助确定最有效的候选药物。
[0192]
在某些实施方式中,微生物钟可搭配微生物和方法来生成,以跟踪和比较不同人群和(或)不同个体的衰老速度。如此微生物始终可与生物途径信息、肠道元基因组的代谢或菌株分析或宿主基因组信息结合使用,以产生老年学、微生物学、免疫学和一般分子生物学领域的新假设。
[0193]
所有公开的微生物标记物的使用实例在方案细节、准确性、法律地位、最终目的等方面可能有所不同,但仍是基于实足年龄和(或)表型年龄与受试者微生物丛(如肠道微生物丛)所含指标相联系之核心思想。同样地,本发明的所有未来实际应用均可进行修改,同时仍受制于本文所述的标记和方法。因此,可能的操作实施方式清单并不局限于本文所述的实施方式,专业人士可大幅延伸。
[0194]
在某些实施方案中,提供了一种根据个体的微生物组分类学剖析预测其表型年龄之方法,具体如下。(a)从个体的微生物组样本中分离出dna或其他核酸,或以其他方式获得核酸;(b)以wgs技术估测样本中微生物分类群的相对丰度,以产生微生物群系的分类特征,或以其他方式获得估计的相对丰度;以及(c)使用机器学习平台处理该分类特征,以预测样本供体的表型年龄。分类学剖析可包括本文描述的微生物,或其在不同表格或不同数字中的集合。在某些方面,步骤(c)使用微生物的衍生信息,如绝对丰度、属级剖析、分类群特定基因计数、生态群丰度等。在某些方面,生物样本被处理以提供具有菌株、物种或属的分辨率的分类学剖析。或者,此种分类学剖析被作为数据库的数据提供。在某些方面,分类学剖析是基于16s可变区域或整个元基因组读数。在某些方面,步骤(b)产生了相对或绝对丰度的分类学剖析。在某些方面,以步骤(b)得到的分类学剖析被用来组成供体微生物群系的相应功能剖析。在某些方面,步骤(a)中的样本为非肠道微生物组(如泌尿生殖器、皮肤、口腔)之样本,或肠道微生物群系。在某些方面,样本供体为人类,亦可为非人类的动物。
[0195]
在某些实施方式中,方法可包括将元基因组剖析与参考剖析进行比较,以便找出产生不同年龄预测的类似微生物组成、可能影响预测的微生物丛改变,并将建议的改变报告给样本供体。
[0196]
在某些实施方式中,方法可包括将元基因组剖析与个人数据,如图像、病史、生物统计学、地理位置等进行汇编,以探索预测年龄与所述个人数据之间的相关性。
[0197]
在某些实施方式中,样本为肠道元基因组,为通过粪便采集或活检所获得。
[0198]
在某些实施方式中,方法可包括使用所得的年龄预测作为表型年龄之测量。该方法亦可包括向样本供体报告预测的表型年龄。预测的表型年龄可与受试者的实足年龄相比较,其差异可用于对健康进行预测。
[0199]
在某些实施方式中,方法亦可包括识别至少一种微生物或微生物类群,其丰度的变化会影响到样本供体之预测,并向其包括此信息。
[0200]
在某些实施方式中,方法可包括将样本供体的资料与参考数据库进行比较,评估其患有与年龄相关疾病之风险,并将关于其风险之信息报告给样本供体。
[0201]
在某些实施方式中,方法可包括创建饮食计划,旨在支持或抑制其丰度变化会影响预测之特定微生物,并将该计划提供给样本供体。
[0202]
在某些实施方式中,方法可包括根据将个人的元基因组特征和年龄预测与参考数据库进行比较,为其生成推荐疗法,并向其报告该疗法。
[0203]
在某些实施方式中,方法可包括一次评估多个元基因组剖析,以发现微生物组衰老之共同决定因素,并使用此信息来建议可影响某群人的微生物丛改变。其中可包括调控预测年龄。这些方法可包括创建参照剖析及其相应预测之数据库。方法可包括关于至少一种特定微生物对年龄预测的影响之信息,该信息允许创建能够改变预测的微生物丛干预措施、开发此类干预措施,并将微生物丛干预措施提供给样本供体、受试者或一般公众。
[0204]
在某些实施方式中,方法可包括根据参考数据库中的概括信息设计消费品,并将该商品交付给消费者。在某些方面,这些方法可包括创造某种化妆品,产品设计旨在支持或抑制其丰度变化会影响预测之特定微生物,并将该产品提供给样本供体、受试者或公众。在某些方面,这些方法可包括创造某种饮食产品,产品设计旨在支持或抑制其丰度变化会影响预测之特定微生物,并将该产品提供给样本供体、受试者或公众。在某些方面,这些方法可包括创造某种医疗产品,产品设计旨在支持或抑制其丰度变化会影响预测之特定微生物,并将该产品提供给样本供体、受试者或公众。在某些方面,这些方法可包括创造某中衣物,产品设计旨在支持或抑制其丰度变化会影响预测之特定微生物,并将该产品交付给样本供体、受试者或公众。
[0205]
在某些实施方式中,方法可包括创建软件,将用户的微生物特征与参考数据库进行比较,并提供关于特定微生物对用户年龄预测的影响之信息,并将这些信息报告给用户。在某些方面,数据库被实现为区块链存储,以跟踪用户的微生物特征进展及其衍生之年龄进展。在某些方面,个人数据仅在其所有者加密保证之协议下才得以被共享。
[0206]
在某些实施方式中,该方法可用于基于分析参考数据库的基础上开发保险单,并将其提供给客户。在某些方面,保单持有人的付款率受其微生物剖析得出的年龄预测之影响。在某些方面,保单持有人被预期提供其微生物学剖析,以及相应的年龄预测之经验证的动态。
[0207]
本发明进一步提供根据年龄相关的微生物丛预测受试者年龄之方法,包括(a)获得受试者的生物样本或其核酸;(b)确定与年龄相关的微生物丛标记物相关的一个或多个基因之数量或百分比,其数量或百分比随年龄变化,或从数据库或站外进行的分析中获得其数据。(c)比较与年龄相关的微生物丛标记物有关的一个或多个基因之数量或百分比,这些标记物的数量或百分比随年龄变化与同一微生物丛年龄相关参考群体之变化而有所变化;以及(d)获得预测受试者年龄的数值或数值范围。其中,比较一个或多个与年龄相关的微生物丛标记物有关的一个或多个基因数量或百分比,该标记物的数量或百分比随年龄而变化,与来自年龄相关的参考群体之同一基因的表达进行比较,包括任何统计方法、多元回归方法、线性回归分析、表格方法或图形方法,用于根据与年龄相关的微生物丛标记相关的基因表达来预测受试者的年龄,这些基因的数量或百分比会随着年龄的变化而有所变化,从而预测受试者的年龄(例如表型年龄)。
[0208]
在某些实施方式中,方法可包括基于输出的预测表型年龄开发某种药物疗法。在某些方面,方法可包括基于生成的输出预测表型年龄开发某种抗衰老疗法。在某些方面,方法可包括基于生成的输出预测表型年龄开发某种衰老修复疗法。
[0209]
在某些实施方式中,基于受试者微生物群系的微生物丛分类学剖析预测受试者表型年龄的方法可包括:从受试者微生物群系样本中分离出多个微生物核酸,或以其他方式获得核酸;分析多个微生物核酸,以根据多个微生物核酸鉴定出微生物群系的微生物量,或以其他方式接收关于微生物量之数据。根据每个微生物的数量或以其他方式接收分类学剖析之数据,生成受试者微生物群系之分类学剖析;使用配置有机器学习平台(例如机器学习平台包括一个或多个深度神经网络)的计算机来处理微生物群系的分类学剖析,以便通过计算受试者的表型年龄来预测实足年龄;生成带有预测的实足年龄和(或)计算的受试者表型年龄之报告;以及向受试者提供该报告。
[0210]
预测的实足年龄,即鉴定的表型年龄,亦称为生物年龄。预测的实足年龄可与实际的实足年龄相比较,其差异可用以鉴定患者健康状况。与实足年龄相比,表型年龄越低,受试者越可能是健康的。表型年龄和实足年龄间的较大差异可用于鉴定疾病状态。
[0211]
在某些实施方式中,微生物群系分类学剖析的处理导致定义以下一项或多项:微生物的绝对数量;各微生物的绝对数量;微生物的各个属的绝对数量之属级分类学剖析;微生物的各个种的绝对数量之种级分类学剖析;微生物的每个菌种的绝对数量的菌种级分类学剖析;分类群的微生物的绝对数量之分类群特定基因数;生态类群的绝对数量。微生物群系中总微生物的相对数量;每种微生物的相对数量;每种微生物属的相对数量;每种微生物种的相对数量;每种微生物菌种的相对数量;每种微生物菌种的相对数量;每种微生物菌种的相对数量;分类群微生物的相对数量分类群特定基因数;生态类群的相对数量;或其组合。
[0212]
在某些实施方式中,方法可包括生成以下一项或多项:基于每个微生物的数量的受试者微生物群系之菌种级分类学剖析;基于每个微生物的数量的受试者微生物群系之物种级分类学剖析;或基于每个微生物的数量的受试者微生物群系之属级分类学剖析。
[0213]
在某些实施方式中,各项分类学剖析是基于16s可变区中的至少一个,或基于整个元基因组读数。
[0214]
在某些实施方式中,方法可包括:访问具多项参考微生物分类学剖析之数据库,该数据库与多名参照受试者的实足年龄和(或)表型年龄相联系;将受试者的微生物群系的分类学剖析与多个参考微生物分类学剖析进行比较;以及将一个或多个与预测表型年龄范围相关的微生物进行分组。
[0215]
在某些实施方式中,方法可包括:鉴定改变的分类学剖析,以将受试者的预测表型年龄降低至比受试者的预测表型年龄更低的预测表型年龄范围;以及将改变的分类学剖析包含于提供给受试者的报告中。
[0216]
在某些实施方式中,方法可包括:鉴定用于获得受试者改变的分类学剖析之处理方法,以在受试者中获得更年轻的预测表型年龄范围;对受试者实施处理方法;以及在受试者中获得更年轻的预测表型年龄范围。
[0217]
在某些实施方式中,与多名参考受试者的实足年龄和(或)表型年龄相关联的多个参考微生物分类学剖析,与参考受试者的个人数据相关联。因此,该方法可包括:获得受试者的个人数据;将受试者的个人数据与生成的受试者的分类学剖析和(或)受试者的预测表型年龄相关联;鉴于与多名参考受试者的实足年龄和(或)表型年龄相关联的多项参考微生物分类学剖析,与参考受试者的个人数据相关联,鉴定受试者的预测表型年龄之相关性。
[0218]
在某些实施方式中,方法可包括:鉴定至少一种微生物,其数量的变化提供了改变的分类学剖析,以将受试者的预测表型年龄降至低于受试者的预测表型年龄之预测表型年龄范围;改变受试者的微生物群系中鉴定的至少一种微生物之数量;以及获得受试者中更年轻的预测表型年龄范围。
[0219]
在某些实施方式中,方法可包括:访问具有与多名参考受试者的多种疾病和(或)疾患相关联之多项参考微生物分类学剖析之数据库;将受试者的微生物群系分类学剖析与多项参考微生物分类学剖析进行比较;鉴定受试者发展多种疾病和(或)其一或多种疾患之风险;以及将受试者发展多种疾病和(或)其一或多种疾患之风险列入报告。
[0220]
在某些实施方案中,方法可包括:鉴定用于获得受试者改变的分类学剖析之饮食计划,以在受试者中获得较轻的预测表型年龄范围;以及将饮食计划纳入报告。在某些方面,方法可以包括:对受试者实施饮食计划;以及在受试者中获得较轻的预测表型年龄范围。
[0221]
在实施方式中,方法可包括:鉴定具一种或多种微生物的治疗性治疗组合物,用于获得受试者改变的分类学剖析,以获得受试者中较轻的预测表型年龄范围;以及确定报告中的治疗性治疗组合物。在某些方面,方法可包括:对受试者实施治疗性治疗组合物;并在受试者中获得较轻的预测表型年龄范围。
[0222]
在某些实施方式中,可提供一种生成参考数据库之方法,该方法可用于任何一种方法,其中可包括:从多个参考样本中的各样本分离出多个微生物核酸,每个参考样本来自参考受试者的微生物群系;分析多个微生物核酸,以根据多个微生物核酸鉴定每名参考受试者的微生物群系之数量。根据各微生物的数量,生成每名参考受试者的微生物群系之分类学剖析;使用配置有机器学习平台的计算机处理每名参考受试者的微生物群系之分类学剖析,以预测每名参考受试者之表型年龄;以及用与每名参考受试者的微生物群系分类学剖析相关之预测表型年龄生成参考数据库。
[0223]
在某些实施方式中,方法可包括:分析与多名参考受试者的年龄和(或)表型年龄相关之多个参考微生物分类学剖析;及鉴定多个参考微生物分类学剖析中与多名参考受试者较高的预测表型年龄相关之一种或多种常见微生物,和(或)鉴定多个参考微生物分类学剖析中与多名参考受试者低的预测表型年龄相关之一种或多种常见微生物。
[0224]
在某些实施方式中,方法可包括:鉴定至少一项改变的分类学剖析,以将参考受试者的预测表型年龄降至低于参考受试者表型年龄之预测表型年龄范围;将至少一项改变的分类学剖析纳入报告;以及向多名参考受试者提供报告。
[0225]
在某些实施方式中,方法可以包括:识别至少一种调节参考受试者表型年龄之特定微生物;创造一种调节组合物,用于调节微生物群系中识别的至少一种特定微生物;以及将调节组合物提供给至少该名受试者。
[0226]
在某些实施方式中,方法可包括生成参考数据库,该数据库具有与多名参考受试者的微生物群系分类学剖析相关的预测表型年龄。
[0227]
在某些实施方式中,方法可以包括:鉴于与多名受试者的微生物群系分类学剖析相关之预测表型年龄,分析来自多名受试者之多项微生物分类学剖析;鉴定影响预测表型年龄之至少一种常见微生物;鉴定至少一种微生物丛改变,以改变至少一名第一受试者的至少一项第一微生物分类学剖析,以获得较低的预测表型年龄;以及选择性地将鉴定的至少一个微生物丛之改变,以第一报告之方式提供给至少一名第一受试者。
[0228]
在某些实施方式中,方法可包括生成具有多项微生物分类学剖析之数据库,所述的多项微生物分类学剖析,与多名受试者的微生物群系的分类学剖析有关之预测表型年龄相关。
[0229]
在某些实施方式中,方法可包括:创建微生物丛干预,以获得至少一个微生物丛改变,以改变至少第一受试者的第一微生物分类学剖析,以获得较低的预测表型年龄;以及向至少第一受试者提供该微生物干预。在某些方面,方法可包括:为进行微生物丛干预设计消费品;并将该消费品提供给至少一名消费者。在某些方面,方法可包括:为进行丛干预设计
饮食产品;以及将该饮食产品提供给至少一名消费者。在某些方面,方法可包括:为进行微生物丛干预设计医疗产品;以及将医疗产品提供给至少一名消费者。在某些方面,方法可包括:为进行微生物丛干预设计衣物;以及将该衣物提供给至少一名消费者。在这些方法中,受试者可利用所提供的物品,以降低其预期表型年龄。
[0230]
在某些实施方式中,方法可包括:生成存储于计算机之有形、非暂时性的存储设备上的计算机程序产品,该计算机程序产品在被执行时,令计算机进行以下操作:根据本文所述的实施例访问数据库;以及对受试者的分类学剖析和数据库进行比较;提供有关至少一种特定微生物之信息,所述的特定微生物可调节与受试者相关的预测表型年龄;生成包含所提供信息之报告;最终将报告提供给受试者。在某些方面,数据库被配置为区块链存储系统,其能够追踪受试者和(或)多名受试者的分类学剖析之变化,以及追踪受试者或多名受试者的预测表型年龄之变化。
[0231]
在某些实施方式中,生成保险单的方法可包括:访问保险简档数据库,该保险简档数据库具有多项微生物分类学剖析;所述微生物分类学剖析与预测的表型年龄相关联,而所述预测表型年龄与多名受试者的各微生物群系之分类学剖析相关。获取保险客户之信息;将保险客户之信息与保险档案数据库进行比较;根据保险客户之信息与保险档案数据库之比较生成保险单;并将保险单提供给保险客户。在某些方面,方法可包括:获得由保险客户的微生物分类学剖析产生的保险客户预测表型年龄;以及获得保险客户的预测表型年龄。根据预测的保险客户表型年龄来确定保险单的费率;并在保险单中包含该费率。在某些方面,通过以下方式获得由保险客户的微生物分类学剖析所产生的保险客户预测表型年龄:从保险客户的微生物群系之样本分离出多种微生物的微生物核酸;分析多种微生物核酸,以基于多种微生物核酸鉴定微生物群系的微生物数量;根据每种微生物的数量,生成保险客户微生物群系之分类学剖析;使用配置有机器学习平台的计算机来处理微生物群系之分类学剖析,以便预测该保险客户的表型年龄;生成含有保险客户预期表型年龄之报告;并将该报告提供给管理保险单之保险提供商。在某些方面,微生物为本文所述的数种。
[0232]
在某些实施方式中,会通过以下方式来获得保险档案数据库。鉴于与多名受试者的微生物群系的分类学剖析相关的预测表型年龄,分析来自多名受试者的多份微生物分类学剖析;鉴定出影响预测表型年龄的至少一种常见微生物;鉴定出至少一种微生物丛改变,以改变至少一名第一受试者之至少一份第一微生物分类学剖析,以获得较轻的预测表型年龄;并将鉴定的至少一个微生物群系改变存储于保险档案数据库中。
[0233]
在某些实施方式中,推导出衰老的微生物生物标志物之方法可包括:创建机器学习模型,该模型经训练可利用微生物样本的分类学剖析来预测宿主年龄;并根据微生物的累积局部效应(ale)函数行为(单调性和范围)选择微生物特征子集。
[0234]
在某些实施方式中,本文任何方法均可使用微生物的生物标志物来进行。所述方法可包括使用本文定义的特定群之生物标记,使所述的类群包括所定义的类群之所有成员。在某些方面,生物标志物和微生物包括其类群,该类群为本技术或合并申请中所叙述的任何类群或组。
[0235]
本发明的某些实施方式允许人们(例如受试者)通过基于网络的应用程序追踪其肠道微生物群系的状态。在此处,受试者可提供生物样本或自生物样本分析中获得的生物数据(如核酸、蛋白质、化学品等)。其后,基于网络的应用程序可向受试者提供本文所述的
报告、数据和分析,例如将信息提供给受试者之计算机(例如笔记本电脑、平板电脑、智能手机、手持设备)。该信息可以是与报告中确定的信息相同之信息,并可包括:基于来自该受试者的一个或多个个体样本的,与该受试者的时间年龄相比较的预测生物年龄;用于选择定义的年龄范围之交互式图表;定义的年龄范围之信息;预测的生物年龄之质量或统计数据(例如mae、rmse r2、pearson's r等);确定生物年龄的数量或类型);识别用于鉴定预测生物年龄的微生物之数量和(或)类型;模型的最小多样性覆盖率;模型的最大多样性覆盖率;不同样本之间的任何数据或结果之比较;预测生物年龄和其他数据或结果在多个样本中之时间比较。具有类似肠道微生物群系的微生物外观之信息,对作为微生物外观之个体进行身份保密;改变预测生物年龄之营养建议;食用益生菌以改变预测生物年龄之身份;不食用益生菌以改变预测生物年龄之身份;或其他信息。
[0236]
基于网络的应用程序之过程亦可包括关于单调递增和递减特征之信息。此可包括将单调递增和递减特征汇总至其他统计数据中,以进一步降低维度。例如,所有单调递减或递增特征可被其加权平均丰度所取代,加权代表其与年龄、ale振幅、ale变化率或其他数值之相关性。如此导致群41(或其他数量的其他群)之最初41个特征折叠为2个维度,可在网络界面上绘制。用户可观察该图或将其提供给专业医生,以确定其肠道丛的整体状况。其后,应用程序界面或专业人员可提供营养建议或药物治疗,以减少单调递增(与老年有关)微生物之数量,或增加单调递减(与年轻有关)微生物之数量。
[0237]
在某些实施方式中,来自受试者的生物样本为含有微生物群系的粪便样本。因此,该方法可包括受试者订购至少一个粪便样本采集容器,再将粪便样本置入采集容器中。其后可将粪便采集容器送去分析来自受试者的微生物群系样本的微生物之核酸。基于网络的应用程序之实体可处理粪便样本,亦可将粪便样本发送至专门的粪便样本设施。在此过程中的某个时刻,无论处理粪便样本的实体为何,均需对微生物群系的核酸进行分析。分析的方法步骤包括生成微生物群系的分类学剖析,使用机器学习平台处理分类学剖析以获得受试者的预测生物年龄,并生成和提供报告,如在受试者的计算设备上显示报告。
[0238]
图22说明了能够执行本文所述方法的应用程序之实施例。此例包括应用程序能够接收或提供已知的微生物群系中各微生物之数量,或接收或提供已知的受试者微生物群系的分类学剖析。在任何情况下,对分类学剖析进行处理,以便获得或预测受试者的生物年龄(例如表型年龄)。最终,该应用程序在报告中向受试者提供显示的信息。报告中可包含一张图表,显示该专利标的与其他专利标的的得分(例如您的得分)。该图表可以是互动的,并允许受试者调整估计参数,如人口中定义的百分比的kde。该报告亦可包括有关生物钟模型结果的图表或表格。报告亦可包括某些微生物的身份或微生物的生物标志物。该信息可被呈现,以便受试者得知可降低的微生物或生物标志物,这些微生物或生物标志物可导致降低预测的生物年龄,选择某种微生物或生物标志物可提供有关如何减少肠道微生物之信息。信息的呈现可使受试者得知可增加的微生物或生物标志物,这些微生物或生物标志物可导致降低预测的生物年龄,而选择某种微生物或生物标志物,可提供如何增加肠道微生物之信息。在图22的例子中,选择了生物标志物6(例如通过点击或悬停在选择图标上),其中增加生物标志物6存在的信息包括:以特定方式调整饮食;避免暴露于特定类型之辐射;避免暴露于特定类型的化合物;锻炼特定技能(例如体育活动、跑步、举重、瑜伽、拉伸等)。
[0239]
在某些实施方式中,可向受试者提供基于订阅之服务。订阅可允许处理多个样本,
并根据多个样本的序列来识别多个生物年龄。如此可允许追踪各样本的最终分数。为了确定可能能够降低较高预测生物年龄之方案,可对样本的趋势及其变化进行分析。接着,该应用程序可向最终用户提供干预措施之提示;这些干预措施可将生物年龄的结果转为较低的预测年龄,如此可能可提升受试者的健康。
[0240]
在某实施例中,所有确定的生物标志物之信息通过以下程序被压缩至2维:
[0241][0242][0243]
此处的“x”是归一化的(例如用0
‑
100%范围内的人群百分位数代替丰度)单调递增特征之丰度向量,而“w”为权重向量(例如ale图数值导数、精确的ale值或其他统计量),“y”为血清隐性特征的归一化丰度向量。这两个新值可针对选定的人群(例如同龄的健康个体)进行计算,以提供核密度估计(kde)图来说明分数分布,并给最终用户参考框架。kde区域可被调整为包含所选人群之特定部分(如90%或50%)。
[0244]
在某些实施方式中,一种为受试者创建微生物组学衰老时钟的方法,该方法包括:(a)接收受试者微生物群系之微生物丰度特征;(b)根据微生物丰度特征创建输入向量;(c)将输入向量输入至机器学习平台;(d)通过机器学习平台基于输入向量生成受试者微生物群系的预测之微生物组衰老时钟,其中所述微生物组学衰老时钟特定于所述微生物群系;以及(e)撰写一份包含微生物组学衰老时钟之报告,该报告确定受试者的预测生物年龄。在某些方面,该方法可包括于规定的确定时间段之后:在第二次迭代中执行步骤(a)、(b)、(c)、(d)、以及(e);并将初始报告与第二次迭代的报告进行比较;并确定于规定的时间段内预测的生物年龄之变化。
[0245]
在某些实施方式中,该方法可以包括:通过重复步骤(a)、(b)、(c)和(或)(d)中之任一或多个步骤,创建至少第二个微生物组学衰老时钟,其中第二个微生物组学衰老时钟是基于来自受试者的微生物群系、受试者的不同微生物群系或第二受试者的微生物群系之第二微生物丰度特征。以及可选择准备一份包括第二微生物组学衰老时钟之报告;该报告确定了受试者、受试者不同组织或器官、或第二受试者的组织或器官之第二预测生物年龄。在某些方面,该方法可包括将微生物组学衰老时钟与第二微生物组学衰老时钟相结合,以创建合成微生物组学衰老时钟,其中合成微生物组学衰老时钟提供受试者的合成生物年龄;此外,可选择准备一份包含合成微生物组学衰老时钟之报告,该报告识别受试者的合成生物年龄。在某些方面,该方法可包括:将组织或器官的预测生物年龄与受试者的实际年龄进行比较;将组织或器官的第二预测生物年龄与受试者的实际年龄进行比较;将组织或器官的合成生物年龄和与受试者的实际年龄进行比较;其中,该方法进一步包括:准备一份包含该比较和与受试者实际年龄差异之报告。
[0246]
在某些实施方式中,该报告包括以下一项或多项:鉴于受试者的实际年龄,基于预测的生物年龄之治疗方案;鉴于受试者的实际年龄,基于预测的生物年龄之饮食方案;关于生活习惯的调查问卷;有和(或)无治疗方案的预期寿命之预后;有和(无)饮食方案的预期寿命之预后;患者在治疗方案中存活的可能性之预后;或患者在饮食方案期间存活的可能性之预后。在某些方面,该方法包括:将初始报告与第二次迭代的报告进行比较;确定预测
的生物年龄在规定时间段内之变化;以及确定:治疗方案是否改变了预测的生物年龄,若治疗方案改变了预测的生物年龄,则确定是否:继续治疗方案、改变治疗方案或停止治疗方案,或者若治疗方案未有改变预测的生物年龄,则确定是否:继续治疗方案、改变治疗方案或停止治疗方案。
[0247]
在某些实施方式中,报告可包括根据受试者实际年龄预测的生物年龄之治疗方案,或根据受试者实际年龄而预测的生物年龄之饮食方案。
[0248]
在某些实施方式中,该方法可包括执行以下一项或多项:基于预测的生物年龄之受试者精算评估;基于预测的生物年龄之风险评估;或基于预测的生物年龄之保险评估。
[0249]
在某些实施方式中,计算机程序产品包括有形、非暂时性的计算机可读介质,该介质上存储有计算机可读程序代码,该代码可由处理器执行,以执行用于患者生物衰老时钟之方法,其中该方法包括由计算机执行其一本文所述的方法之步骤。
[0250]
实施例
[0251]
dfs操作实施例中使用的所有数据,均来自于已发表的研究(在sra和ena的项目id:erp019502、erp009422、srp002163、erp004605、erp002469、erp008729、erp005534)。
[0252]
所有这些研究均采用类似的样本制备技术。粪便样本(约50克)从健康供体取得,若无法立即进行dna分离,则将样本保存于4℃或冷冻于
‑
80℃之环境,以防止细菌繁殖。
[0253]
dna可在使用各种试剂盒和方法来进行分离,为在illumina genome analyzer ii或illumina hiseq 2000平台上进行wgs测序做准备(wesolowska
‑
andersen等学者,2014年)。可实施读数处理和分类学剖析。下载的测序文件没被降低取样频率。质量控制包括去除适配体、质量修整和质量过滤、去除人类读数。此外,还对4聚体分布的熵进行了评估,以验证无任何样本被过度稀释。在离心机中针对先前释放的细菌和古菌基因组的fm指数对读段作图。各样本的相对丰度表经过过滤,使其仅包含可靠检测到的微生物(相对丰度>1e
‑
5)。
[0254]
本研究将数种机器学习方法用于年龄预测。机器学习问题的目标为经典的监督性回归。模型以细菌分类群特征作为输入变量进行训练。
[0255]
用于训练机器学习算法的数据经修改,使其仅包含可靠检测到的特征(>1e
‑
5丰度)。在去除不存在或缺失的年龄值后,数据规模为来自621人的3'058条记录。每条记录包含1'673种细菌特征。目标变量包括7至90岁范围内之年龄。年龄分布如图12所描述。
[0256]
模型的训练采用五重交叉验证和网格或随机搜索策略,以补偿过拟合。由于数据集的规模相当适中,并无引入外部测试集。相反地,给定的指标为对每等分的5个测试集之预测,从而产生了完全预测的输入数据集。为了公平比较,所有的模型均使用相同的折线分割法来进行评估。
[0257]
所有方法均显示出预测年龄与实际年龄有相对较好的相关性,然而梯度提升器和dfs的表现均优于其他模型。dfs模型的最佳配置有3层,每层有512个神经元,prelu激活函数和学习率为0.001。最佳梯度提升配置的树的最大深度为6,学习率为0.1,最大delta步长为2,二级正则化项为0,一级正则化项为0.5。表5列出了xgb和dfs模型的cv结果。
[0258]
表5
[0259]
模型maermser2pearsonxgb3.815.630.900.95
r、均方误差或中位数绝对误差。在交叉验证中获得的最佳配置为:3x1024节点、relu激活功能、adam优化器、每一层以0.5之机率丢弃(dropout)和0.001的学习率。此来自模型2。
[0268]
方法1400可包括生成一组具有低误差的模型之模型集合(单元1416)。显示出最小误差的模型被组合为一个合集,再将其用于先前未触及的验证数据集,其后通过取其平均预测值对合集模型的各预测值进行平均。其他的汇总方法亦可为有效的;例如,在取中值或去除离群的预测值后进行汇总,或选取预测范围的中点。最终模型误差被报告为最佳配置的mae——5.91年。此来自模型2。
[0269]
评估益生菌对宿主状况之影响
[0270]
本文所述的生物钟模型可用于评估益生菌对宿主状况的影响,此可包括假设施用益生菌仅改变益生菌之丰度。因此,使用该模型可轻易检查出特定的微生物如何影响肠道年龄。通过模型2对16种市售益生菌的老年学潜力进行了评估,微生物如下:bacillus coagulans、bifidobacterium animalis、bifidobacterium bifidum、bifidobacterium breve、bifidobacterium longum、enterococcus faecium、lactobacillus acidophilus、lactobacillus casei、lactobacillus gasseri、lactobacillus helveticus、lactobacillus plantarum、lactobacillus reuteri、lactobacillus rhamnosus、lactobacillus salivarius、propionibacterium freudenreichii以及streptococcus thermophilus。然而,使用所述方法可检查任何其他微生物的效果,其丰度属于模型输入。在某些方面,本段落的微生物为特定的类群,并用为特定的组合,此处的“类群16”指定了该类群中的16个特定成员。据此,各16种所提及的不同类型的微生物存在于类群16。
[0271]
为了说明这些益生菌如何在个体水平上影响年龄预测,该方案在七个相对丰度剖析中将其丰度提高了1%,并计算预测年龄的变化。亦可应用其他的数字区分方法。使用该模型,无法估计益生菌的植入效率,因此,预测的年龄变化的绝对值不如变化的迹象这般重要。然而,年龄变化的迹象可用来预测益生菌引起老年保护作用之能力。图15显示了增加16种益生菌在微生物丛剖析中的模拟效果,其中深灰色为预测年龄增加,浅灰色为预测年龄减少,白色则为预测年龄无变化。
[0272]
从图15的例子可看出,通过使用生物钟模型,不同的人对同一细菌的预测年龄可产生正面和负面的影响。为了解某种细菌如何在人口水平上影响肠道年龄,建议使用累积局部效应(ale)。本文提供了计算ale的方法。
[0273]
数据显示,模型中使用的某些微生物在>50岁之群体中确定为单调递减。增加其中某些微生物几乎有线性影响,而其他微生物仅在其丰度分布的高端影响年龄预测,某些微生物可能对群体有非单调的影响。图16a和图16b表中的结果是通过处理公开的ena条目所得,并提供了概念证明。
[0274]
图16b中的数据显示了6种微生物对50岁以上人口取样之影响。x轴上两点之间ale的变化表示预测年龄之平均变化,同时转移了某微生物之丰度。在每个特定情况下,仅考虑微生物丰度不为零的之人。
[0275]
图16a中的数据显示预测的平均变化,同时在50岁以上的受试者子样本中转移了微生物之丰度。在每个特定情况下,仅考虑微生物丰度不为零的之人。
[0276]
预测疾病和发病之风险
[0277]
生物钟模型亦可用于评估肠道年龄,以用于发病率预测。此亦可用于预测肥胖症
之风险。例如,通过使用生物钟模型和微生物组学信息,可预测身体质量指数(bmi)。
[0278]
在某些实施方式中,生物钟模型可用于预测bmi值。生物钟模型预测的肠道年龄可与微生物组学信息一并用于预测一个人的bmi值,作为替代肥胖风险指标。使用314种流行的微生物物种丰度之信息(如离心机指数中所定义)和预测的肠道年龄,该模型成功地估算出宿主的bmi值优于基线中值分配。具体的微生物有:
[0279]
用于训练和验证bmi预测器的样本包含968个已知bmi值和年龄预测误差<10岁的微生物群系配置文件。图23提供了其中30份样本的例子,其中显示了样本id、实际bmi值、预测bmi值、预测表型年龄和实际年龄。这些资料也被用于老化钟的训练,其预测年龄是在交叉验证阶段鉴定出的。这些剖析取自存放于ena之样本。离心机指数的特定版本为“取自最后更新于2018年4月15日的《细菌、古菌》”。
[0280]
中位bmi分配产生的mae为4.129kg/m2,而生物钟模型的mae为3.642
±
0.208kg/m2,这是在五个等分中估计的。bmi值估算器作为梯度提升回归器来实现,以xgboost 0.90python 3.7.3库创建。训练期间使用的确切参数为:{alpha:0,eta:0.1,eval_metric:mae,gamma:0.0,lambda:0.5,max_delta_step:0.0max_depth:6,tree_method:gpu_hist},此作为例子提供。然而,亦可使用其变型。
[0281]
图17显示了以xgboost模型获得的bmi预测值的核心密度估计(kde)图,该图适用于968个相对丰度剖析,并附带肠道年龄之信息。该线表示观测值的普通最小二乘回归,其方程式为(bmi预测值)=0.215
×
(实际bmi值)+20.16。
[0282]
在某些实施方式中,生物钟可用于预测患i型糖尿病(t1d)风险之方法,该方法可使用模型2。在验证包含1,606种特征的肠道年龄预测器时,对方案进行了修改,将从t1d患者获得的资料纳入验证集。根据用t1d数据训练的生物钟模型,t1d患者被预测的年龄更可能比实际年龄高,其中平均误差为+14.75岁。作为比较,本研究中健康宿主的资料(prjna289586)的平均预测误差为+0.41。同时t1d宿主的mae为18.02岁,健康宿主的mae为为8.40岁。因此,糖尿病患者的误差分布偏向于高正数,此可作为其健康状况之指标,从而作为糖尿病的生物标志物。
[0283]
图18显示了模型2在一组独立的436份样本中的表现,这些样本来自存放于ena服务器之公共研究(erp000108、prjna375935、prjna289586),后者包含34个来自患有1型糖尿病供体之样本。中位年龄分配提供了一个9.27岁平均绝对误差(mae)之基线,而本模型显示mae为5.91岁(r2得分=0.81)。同时,该模型未能准确预测糖尿病患者的年龄(r2得分=
‑
0.73,mae=18.02岁,基线=13.65岁),并且分配给年轻的糖尿病患者供体的年龄高于其实际年龄。这表明该模型有资格作为健康人的准确衰老时钟,并对疾病作为年龄影响的条件作出反应。图18包括一个用于年龄预测的验证集(n
total
=323,n
t1d
=34),该模型包含1,606种特征。虚线为糖尿病患者资料之ols回归,实线为健康人资料的ols回归。糖尿病患者的预测年龄通常比健康人的预测年龄高。
[0284]
生物衰老时钟模型
[0285]
以下实施例提供了一种降低高通量生物数据的维度之方法,并根据其对衰老过程的影响大小对特征进行排序。该方法可包括两部分,如图19所示:(1)训练可靠的衰老时钟模型,以及(2)将累积局部效应(ale)应用于模型,以测量其对特征值变化之反应。最初的衰老时钟可在任何生物相关的数据上训练,唯一限制在于其为有限的预定维度(例如微生物
相对丰度的矢量)。该模型在本质上可代表任何机器学习的方法,包括所述实施例中使用的深度神经网络(dnn)。
[0286]
在此实施例中,对dnn模型进行了训练,以根据其肠道丛相对丰度剖析预测一个人的年龄。dnn模型由3个隐含层组成,每层有1,024个节点,使用prelu激活功能进行了训练,丢弃(dropout)率为0.5,学习率为0.001。仅使用20
‑
90岁群体之样本,每个供体仅使用一份样本,共有1,165名供体。
[0287]
在独立的数据集验证过程中,该模型的平均绝对误差为5.91岁,基线(年龄分配中位数)产生9.27岁之误差。1型糖尿病患者的预测年龄比实足年龄高,导致18.02岁的误差,基线为13.65岁。因此,该模型准确预测出健康人的年龄,并通过高估患病者的年龄作出反应。
[0288]
接着对该模型进行累积局部效应分析(ale),观察该模型对特定微生物丰度的轻微变化有何反应。若在对微生物进行模拟使其丰度更高时,该模型通过平均降低预测年龄做出反应,该微生物则会被分配为的单调递减之状态。若模型随着微生物丰度的增加而产生更高的预测年龄,则为单调递增。例如ale方程式1可用于计算每个四分位数的局部效应(le)。为了产生ale,les将被按照ale方程2相加。
[0289]
此外,ale是居中的,因此特征的所有ale之和为零。
[0290]
在此实施例中,老化的生物标志物是根据ale的振幅来选择的,例如通过改变某个特征值可实现预测的最大转变。仅选择振幅高于0.1岁之特征,产生本处定义的群41之微生物列表。然而,亦可使用本处定义的其他微生物群系。
[0291]
为了估计某特征对模型性能的影响,根据选定的特征分布(在此情况下,步长为25%),将所有样本从单个集合中分离成相等的分箱(bin)。接着对每个分箱的预测年龄在其左右边界进行计算,对之间的预测变化进行平均,以获得局部效应(le)。局部效应被进一步加总为累积局部效应(ale),以连续显某特征的影响。在最后一步,所有累积局部效应被移位,使平均累积局部效应为零。见图19。
[0292]
多数特征在进行累积局部效应(ale)分析时,通常会显示单调的增长或下降。显示出预测年龄随数值的增加而增加之特征(递增ale图)被称为单调递增。另一方面,预测年龄随数值的增加而减少的特征(递减ale图)被称为单调递减。某些特征不产生单调的ale图,但大多数为单调的。图20显示了最大值和最小值位于特征分布的最左分箱(bin)特征之ale图,即单调递减和单调递增之特征。因此,图20提供了肠道微生物丛老化时钟的单调递增和单调递减行为之例子,以及几种非单调的特征。ale被归一化,位于[0;1]区域内,实际振幅不同。
[0293]
定义:
[0294]“人工神经网络”亦称“ann”或简称为“神经网络”,是基于被称为人工神经元的庞大相连简单单元之集合,这些单元与生物学脑中的轴突大致相似。若合并的传入信号足够强大,神经元就会被激活,信号会传到与之相连的其他神经元。这类神经元的激活函数通常(尽管并不总是)表示为西格玛函数。
[0295]
"深度学习"(dl)(亦称深度结构化学习、分层学习或深度机器学习)是对包含多个神经元隐藏层的人工神经网络之研究。这种神经网络被称为“深度神经网络”。“卷积神经网络”为一种神经网络,其中的连接模式受到动物视觉皮层组织之启发。
[0296]“深度特征选择”(dfs)是一种机器学习方法,基于在输入层和多层感知器(mlp)的第一隐藏层之间添加稀疏的一对一线性层。
[0297]“平均绝对误差”(mae)是一种质量指标,相等于预测和观察年龄之间的平均绝对差异。
[0298]“交换特征重要性”(pfi)是一种估计机器学习模型中特征重要性的方法,基于测量交换特定特征后预测能力的降低。
[0299]“多层感知器”(mlp)是一种用于监督学习的神经网络模型,由3层以上组成,用于区分线性不可分割的数据。
[0300]“全基因组测序”(wgs)为分析整个基因组的全面方法,建议在读取长dna分子之前先对其进行片段化。wgs方法的输出通常是一个包含105
‑
106个短dna序列之文件。
[0301]“xgboost”(xgb)为梯度提升机器学习技术的开源实现,依赖于迭代结合弱预测模型。
[0302]“人类肠道微生物组”为栖息于人类肠道中的所有微生物群系落之聚集体。微生物群系为栖息于人类肠道中的所有生物的总和。“肠道微生物组样本”通常代表微生物学中的“粪便样本”,亦可使用活检样本。
[0303]“分类学剖析”为包括群落中所有微生物的相对或绝对数量、丰度或百分比之向量。所有的分类学剖析的总和为1或100%。也就是不同微生物的数量为分数,总和为1或高达100%。
[0304]“累积局部效应”(ale)为将模型中特征的重要性可视化之方法。本专利中的ale得分,是以较低和较高5%的分位数替换目标分类单元丰度后的预测年龄平均变化。
[0305]“元基因组”为群落中存在的所有dna信息之集合,通常由含有测序过程中确定的短序列(长度为100
‑
200核苷酸的读数)的文本文件来表示。
[0306]“分箱”为将测序输出文件中的每个读数分配给一个或多个分类单元或分类群之程序。
[0307]“表型年龄”为人体健康的综合指标,反映出与所有实足年龄段的健康个体相比,个体发生与年龄有关的疾病之可能性,以及其有机体之性能。
[0308]“工作流”(pipeline)为是一系列按顺序执行的程序,这些程序接收原始数据、进行数据格式化、过滤和规范化、执行计算并生成输出,可以为预测模型、生成模型、数据统计或估计之隐藏变量。
[0309]
实足年龄(chronological)为某受试者或有机体之实际年龄。对于动物和人类而言,实足年龄可基于从受孕时开始计算之年龄,或基于从出生时间和日期开始计算之年龄。细胞、组织或器官的年龄可根据获得该细胞、组织或器官的受试者或有机体之年龄,加上该细胞、组织或器官置于培养中的时间来确定。或者,在细胞或组织培养之情况下,年龄可与培养的总时间或累积时间或传代次数有关。
[0310]
表型年龄可能是、也可能不是受试者或有机体的实足年龄,但表型年龄是身体或器官在生物学上显现的年龄。虽然受试者实际上可能是40岁,但其生物学上的表型年龄可能远高于或低于40岁。表型年龄可包括个体的基因型与环境相互作用而产生的一系列可观察的特征。表型年龄与个体的生理健康及其生物标志物有关。表型年龄与人体器官和调节系统的性能如何、在多大程度上维持有机体各层次的总体平衡有关,因为这些功能一般会
随时间和年龄的增长而下降。
[0311]
生物年龄被定义为个体说明个人健康问题风险之分数。在衰老时钟中,最典型的定义为衰老生物标志物f(b)—>rn在数字线上的投影,代表着实足年龄。f(b)以最大化概率p(ca=f(b)|b)构造,其中ca代表个体的实际实足年龄;因此,比较f(b)和ca之间的距离传达了关于个体的健康状况之信息。此为微生物钟的实施方案中定义生物年龄之方式。然而,生物年龄亦可提供未来发展特定健康状况之风险、剩余的预期寿命或与年龄相对应者之间的距离。
[0312]
对于本处揭露之程序和方法,在程序和方法中执行的操作可以不同的顺序实施。此外,所概述的操作仅作为示例提供,某些操作可以为选择性、被消除,补充有进一步的操作、或扩展为附加的操作,而不背离所揭露的实施例之本质。
[0313]
受试者可以为人类、哺乳动物、动物、植物或任何多细胞生物体。合适的哺乳动物的例子包括(但不限于)人类、猴子、猿猴、狗、猫、牛、马、山羊、猪、兔、小鼠和大鼠。
[0314]
生物样本可以为血液、淋巴细胞、单核细胞、中性粒细胞、嗜碱性细胞、嗜酸性细胞、骨髓系细胞、淋巴系细胞、骨髓、唾液、口腔组织、鼻腔组织、尿液、粪便物、毛发、乳腺组织、卵巢组织、子宫组织、宫颈组织、前列腺组织、睾丸组织、脑组织、神经元细胞、星形细胞、肝组织、肾脏、甲状腺组织、胃组织、肠组织。胰腺组织、血管组织、皮肤、肺组织、骨组织、软骨、韧带、肌腱、脂肪细胞、肌肉细胞、神经元、星形胶质细胞、不同通道数的培养细胞、癌症或肿瘤细胞、癌症或肿瘤组织、正常细胞、正常组织、任何含有遗传物质的细胞核的组织或细胞,或已知或未知受试者的dna形式之遗传物质,如本文所述之微生物标记。
[0315]
本揭露内容不局限于本技术中描述的特定实施方式,这些实施方式旨对各层面进行描述。在不背离其精神和范围之情况下,可进行多次修改和变动。除了在此列举的方法和装置外,在本技术范围内的功能等同的方法和装置亦可从上述描述中得到。此类修改和变化是为了落在所附权利要求的范围内。本揭露书仅受限于所附专利请求项条款,以及这些请求项有权获得的全部等价物之范围。本处使用的术语仅用于描述特定的实施方式,并不意味着是限制性的。
[0316]
在一实施方式中,本发明的方法可包括在计算系统上执行的方面。因此,计算系统可包括具有用于执行本方法的计算机可执行指令之存储设备。计算机可执行指令可为计算机程序产品之一部分,该计算机程序产品包括一个或多个用于执行任何权利项中的任何方法之算法。
[0317]
在一实施方式中,本文所述的任何操作、过程或方法,均可响应于存储在计算机可读介质上并可由一个或多个处理器执行的计算机可读指令之执行而被执行、或导致被执行。该计算机可读指令可由来自桌面计算系统、便携式计算系统、平板电脑计算系统、手持式计算系统以及网络元素和(或)任何其他计算设备的广泛计算系统之处理器执行。该计算机可读介质并非暂时性。计算机可读介质为一种物理介质,其中存储有计算机可读指令,以便由计算机或处理器从该物理介质中物理性地读取。
[0318]
可实现本文所述的过程和(或)系统和(或)其他技术(例如硬件、软件和(或)固件)之各种载体,且优选的载体可随着部署过程和(或)系统和(或)其他技术的环境而变化。例如,若实施者确定速度和准确性至为重要,实施者可选择主要为硬件和(或)固件之载体;若灵活性至为重要,实施者可选择主要采用软件实现;或者,替代地,实施者可选择硬件、软件
和(或)固件的某些组合。
[0319]
本文所述的各种操作可通过各种硬件、软件、固件或其几乎任何组合单独和(或)共同地实现。在某实施方式中,本文所述专利标的的数个部分可通过特定应用集成电路(asic)、现场可编程门阵列(fpga)、数字信号处理器(dsp)或其他集成格式实现。然而,本文披露的实施方式之某些方面,全部或部分可等效地在集成电路中实现,作为单个或多个计算机程序运行于一部或多部计算机(例如作为一个或多个程序运行于一个或多个计算机系统),作为一个或多个程序运行于一个或多个处理器(例如,作为一个或多个程序运行于一个或多个微处理器),作为固件、或作为其本质上任何组合,并且根据本披露书,设计电路和(或)编写软件和(或)固件的代码,是可行的。此外,本文所述专利标的的机制能够作为程序产品以各种形式分发,且本文描述的专利标的的说明性实施例适用,而无关实际使用的信号承载介质之特定类型。物理信号承载介质的例子包括但不限于以下:可记录类型的介质,如软盘、硬盘驱动器(hdd)、光盘(cd)、数字多功能光盘(dvd)、数字磁带、计算机内存,或任何其他非短暂性或传输性的物理介质。具有计算机可读指令的物理介质之示例省略了暂时性或传输型介质,如数字和(或)模拟通信介质(例如光缆、波导、有线通信链路、无线通信链路等)。
[0320]
以本文所述方式描述装置和(或)过程,并在此后使用工程实践将此种描述的装置和(或)过程集成到数据处理系统中,实属常见。意即,本文所描述的装置和(或)过程的至少一部分,可通过合理的实验被集成到数据处理系统中。典型的数据处理系统通常包括一个或多个系统单元外壳、视频显示设备、存储器,如易失性和非易失性存储器、处理器,如微处理器和数字信号处理器、计算实体,如操作系统、驱动程序、图形用户界面和应用程序、一个或多个交互设备,如触摸板或屏幕,和(或)控制系统,包括反馈回路和控制电机(例如用于感应位置和(或)速度之反馈;用于移动和(或)调整组件和(或)数量之控制电机)。典型的数据处理系统可利用任何合适的市售组件来实现,例如在数据计算、通信和(或)网络计算或通信系统中常见的组件。
[0321]
本文描述的专利标的有时示出了包含于不同的其他组件中、或与不同的其他组件相连的组建。此种描述的架构仅为示例性,事实上,许多其他架构可实现,从而实现相同的功能。从概念上而论,任何实现相同功能的组件排列均是有效的“关联”,从而实现了所需的功能。因此,本文中组合以实现特定功能的任何两个组件可被视为彼此“关联”,从而实现期望的功能,而无关于体系结构或中间组件。同样地,任何两个如此关联的组件亦可被视为彼此”可操作地连接“或“可操作地耦合”,以实现所需的功能,并且任何两个能够如此关联的组件亦可被视为彼此”可操作地耦合“,以实现所需的功能。可操作性耦合的具体例子包括但不限于:可物理配合和(或)物理交互之组件,和(或)可无线交互和(或)无线交互之组件,和(或)逻辑上交互和(或)逻辑上可交互之组件。
[0322]
图6显示了一部示例性的计算设备600(例如计算机),其可在某些实施方式中被安排以执行本文所述之方法(或其部分)。在非常基本的配置602中,计算设备600一般包括一个或多个处理器604和一个系统存储器606。存储器总线608可用于在处理器604和系统存储器606之间进行通信。
[0323]
根据所需配置,处理器604可为任何类型,包括但不限于:微处理器(μp)、微控制器(μc)、数字信号处理器(dsp)或其任何组合。处理器604可包括一个或多个级别的缓存,例如
一级缓存610和二级缓存612,一个处理器内核614和寄存器616。一个示例性的处理器核心614可包括一个算术逻辑单元(alu)、一个浮点单元(fpu)、一个数字信号处理核心(dsp核心)或其任何组合。一个示例性的存储器控制器618亦可与处理器604一并使用,或在某些实施方案中,存储器控制器618可为处理器604的一个内部部分。
[0324]
根据所需的配置,系统存储器606可为任何类型,包括但不限于:易失性存储器(如ram)、非易失性存储器(如rom、闪存等)或其任何组合。系统存储器606可包括操作系统620、一个或多个应用程序622、以及程序数据624。应用程序622可包括确定应用程序626,该确定应用程序被安排为执行本文所述之操作,包括关于本文所述方法之操作。确定应用程序626可获得数据,例如压力、流速和(或)温度,再确定对系统的改变以改变压力、流速和(或)温度。
[0325]
计算设备600可具有额外特征或功能,以及额外接口,以促进基本配置602和任何所需设备和接口间的通信。例如,总线或接口控制器630可用于促进基本配置602和一个或多个数据存储设备632间通过存储接口总线634之通信。数据存储设备632可为移动存储设备636、非可移动存储设备638或其组合。仅举几例,可移动存储和非可移动存储设备包括:磁性磁盘设备,如柔性磁盘驱动器和硬盘驱动器(hdd);光盘驱动器,如压缩磁盘(cd)驱动器或数字多功能磁盘(dvd)驱动器、固态驱动器(ssd)和磁带驱动器。示例计算机存储介质可包括:以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据之类的信息之任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。
[0326]
系统存储器606、可移动存储设备636和非可移动存储设备638为计算机存储介质的示例。计算机存储介质包括但不限于:ram、rom、eeprom、闪存或其他存储技术、cd
‑
rom、数字多功能磁盘(dvd)或其他光学存储、磁带、磁光盘存储或其他磁性存储设备,或可用于存储所需信息,并可由计算设备600访问的任何其他介质。任何此类计算机存储介质均可为计算设备600之一部分。
[0327]
计算设备600亦可包括接口总线640,用于通过总线或接口控制器630促进从各种接口设备(例如输出设备642、外围接口644和通信设备646)至基本配置602之通信。示例性的输出设备642包含图形处理单元648和音频处理单元650,可被配置为通过一个或多个a/v端口652与各种外部设备如显示器或扬声器进行通信。示例性的外围接口644包含串行接口控制器654或并行接口控制器656,可被配置为通过一个或多个i/o端口658与外部设备,如输入设备(例如键盘、鼠标、笔、语音输入设备、触摸输入设备等)或其他外围设备(例如打印机、扫描仪等)通信。示例性的通信设备646包含网络控制器660,该网络控制器可被安排为便利通过一个或多个通信端口664之网络通信链路,与一个或多个其他计算设备662进行通信。
[0328]
网络通信链路可为通信媒体的一个例子。通信媒体一般可由计算机可读指令、数据结构、程序模块或调制数据信号中的其他数据体现,如载波或其他传输机制,并可包括任何信息传递媒体。“调制数据信号”可为以其信息中编码信息之方式设置、或改变其一或多个特征之信号。通过举例(而非限制),通信媒体可包括有线媒体,如有线网络或直接有线连接,以及无线媒体,如声音、射频(rf)、微波、红外(ir)和其他无线媒体。本文所用术语计算机可读介质可包括存储介质和通信介质。
[0329]
计算设备600可实现为小尺寸便携式(或移动)电子设备之一部分,例如手机、个人
数据助理(pda)、个人媒体播放器设备、无线网络手表设备、个人耳机设备、特定应用设备或包括上述任何功能之混合设备。计算设备600亦可实现为个人计算机,包括笔记本电脑和非笔记本电脑之配置。计算设备600亦可为任何类型的网络计算设备。计算设备600亦可为本文所述之自动系统。
[0330]
本文所述的实施方式,可包括使用包含各种计算机硬件或软件模块之特殊用途或通用计算机。
[0331]
本发明范围内的实施方式亦包括用于承载、或具有计算机可执行指令或存储的数据结构之计算机可读介质。此类计算机可读介质可为任何可用的介质,可被通用或特殊用途的计算机访问。作为举例,而非限制,此类计算机可读介质可包括ram、rom、eeprom、cd
‑
rom或其他光盘存储、磁盘存储或其他磁性存储设备,或任何其他可用于携带或存储计算机可执行指令或数据结构形式之所需程序代码手段、且可由通用或特殊用途计算机访问之介质。当信息通过网络或其他通信连接(无论是硬线、无线,还是硬线或无线之组合)传输或提供给计算机时,计算机正确地将该连接视为计算机可读介质。因此,任何这般连接被正确地称为计算机可读介质。以上各项组合亦应包含于计算机可读介质之范围内。
[0332]
举例而言,计算机可执行指令包括使通用计算机、特殊用途计算机或特殊用途处理装置执行特定功能或一组功能的指令和数据。尽管该专利标的已用具体的语言描述了结构特征和(或)方法行为,但应理解的是,所附权利项中定义的专利标的不一定限于上述具体特征或行为。相反地,上述具体特征和行为是作为实施权利项之示例形式披露。
[0333]
关于本文中基本上任何复数和(或)单数术语之使用,本领域技术人员可根据环境背景和(或)应用之需要,将复数翻译为单数和(或)由单数翻译为复数。为清楚起见,各种单数(复)数之排列组合,可在此明确提出。
[0334]
本领域之人将理解,一般而言,在本文中,尤指所附权利项使用之用语(例如所附权利项之专利标的)通常旨在作为“开放性”用语(例如用语“包括”应当解释为“包括但不限于”,用语“具有”应解释为“至少具有”,用语“包含”应解释为“包含但不限于”,诸如此类)。本领域之人将进一步理解,倘若意图引入特定数量之引入权利项叙述,则将于该权利项中明确地陈述此等意图;在无此陈述之情况下,则不存在此等意图。举例而言,为了帮助理解,以下所附权利项可包含介绍性短语,如“至少一项”和“一项或多项”之使用,以引入权利项之叙述。然而,使用这般短语,不应被解释为暗示由不定冠词“一项”或“一种”引入的权利项陈述,将任何包含此类引入只权利项陈述之特定权利项限制为仅包含一个此类陈述之实施例,即使同一权利项包括介绍性短语“一项或多项”或“至少一项”,以及不定冠词如“一项”或“一种”(例如“一项”和(或)“一种”应解释为“至少”一项”或“一种或多种”);对于用于引入权利项陈述的定冠词之使用,亦是如此。此外,即使明确叙述了具体数量之引入权利项叙述,本领域之人将认识到,此类叙述应被解释为至少意味着所叙述之数目(例如“两个详述”之裸露叙述,而无其他修饰语,是指至少两次详述,或两次或多次详述)。此外,在使用类似于“a、b和c等之中至少一项”之情况下,通常使用“结构”一词之意图为本领域之人应理解之意义上所进行的(例如,“具有a、b和c之中至少一个系统”将包括但不限于具有单独a、单独b、单独c、a和b共同、a与c共同、b与c共同和(或)a、b和c共同等等之系统)。本领域技术人员将进一步理解,无论在描述、权利项或附图中,几乎任何呈现两个或更多备选术语之非连接词和(或)之短语,均应理解为考虑包括其一、另一或两者之可能性。例如,短语“a或b”将被
理解为包含“a”或“b”或“a和b”之可能性。
[0335]
此外,在本揭露书的特征或方面根据马库什群组来描述之情况下,本领域之人将认识到,揭露书亦因此以马尔库什组之任何单个成员或子组成员之术语来描述。
[0336]
正如本领域技术人员所理解,为了任何和所有的目的,例如在提供书面描述方面,此处披露之所有范围亦可包括任何和所有可能之子范围和其子范围之组合。任何列出的范围均可轻易被确认为充分描述,并使同一范围至少被分解为相等的二分之一、三分之一、四分之一、五分之一、十分之一等等。作为非限制性的例子,此处讨论之各个范围均可轻易被细分为下三分之一、中三分之一和高三分之一等等。本领域技术人员亦可理解,所有用语,如“至多”、“至少”等,均包含所列举之数字,并指随后可细分为上述子范围之范围。最后,如本领域技术人员所理解,一个范围包含每个单独的成员。因此,例如一个具有1到3个细胞之群组,是指具有1、2或3个细胞之群组。同样地,具有1到5个细胞之群组,是指具有1、2、3、4或5个细胞之群组,以此类推。
[0337]
由上述可见,为了说明问题,此处已描述本揭露书之各种实施方式,并且在不背离本揭露书范围和精神之情况下,可进行各种修改。因此,本文所披露之各种实施方式,并非意味着具有限制性,其真正范围和精神由以下权利项所表明。
[0338]
本专利申请之交叉引用:于2019年5月17日提交之美国第16/415,855号;于2018年8月17日提交之美国第16/104,391号;于2018年7月25日提交之美国第16/044,784号;于2017年7月25日提交之美国第62/536,658号;以及于2017年8月17日提交之美国第62/547,061号,其中各项申请通过特定引用纳入本文。
[0339]
本文所提及之所有参考文献均通过特定引用纳入本文。
[0340]
参考文献
[0341]
blalock、eric m.、kuey
‑
chu chen、keith sharrow、james p.herman、nada m.porter、thomas c.foster和philip w.landfield。2003年。《海马区老化的基因微阵列:统计剖析确定了与认知障碍有关的新过程》《神经科学期刊:神经科学学会官方期刊》23(9):3807
–
19。
[0342]
chowers、itay,dongmei liu、ronald h.farkas、tushara l.gunatilaka、abigail s.hackam、steven l.bernstein、peter a.campochiaro、giovanni parmigiani和donald j.zack。2003年。《成年人类视网膜的基因表达变化》《人类分子遗传学》12(22):2881
–
93。
[0343]
hong、mun
‑
gwan、amanda j.myers、patrik k.e.magnusson和jonathan a.prince。2008年。《人脑和淋巴细胞衰老的转录组评估》。plos one 3(8):e3024。
[0344]
horvath、steve。2013年。《人类组织和细胞类型的dna甲基化年龄》《基因组生物学》14(10):r115。
[0345]
horvath、steve,yafeng zhang、peter langfelder、ren
é
s.kahn、marco p.m.boks、kristel van eijk、leonard h.van den berg和roel a.ophoff。2012年。《衰老对人脑和血液组织中dna甲基化模块之影响》《基因组生物学》13(10):r97。
[0346]
pedro de、curado和george m.church。2009年。《与年龄相关的基因表达剖析之的元分析确定了衰老的共同特征》《生物信息学》25(7):875
–
81。
[0347]
mendelsohn、andrew r.和james w.larrick。2013年。《dna甲基组作为表观遗传不稳定性和人类衰老之生物标志物》《回复青春研究》16(1):74
–
77。
[0348]
park、sang
‑
kyu、kyoungmi kim、grier p.page、david b.allison、richard weindruch和tomas a.prolla。2009年。《多品系小鼠衰老的基因表达剖析:识别衰老生物标志物和饮食抗氧化剂之影响》《衰老细胞》8(4):484
–
95。
[0349]
park、sang
‑
kyu和tomas a.prolla。2005年。《心肌和骨骼肌老化的基因表达剖析研究》《《心血管研究》66(2):205
–
12。
[0350]
weindruch、richard、tsuyoshi kayo、cheol
‑
koo lee和tomas a.prolla。2002年。《使用dna微阵列进行衰老的基因表达剖析》《衰老和发展的机制》123(2
‑
3):177
–
93。
[0351]
welle、stephen、andrew i.brooks、joseph m.delehanty、nancy needler和charles a.thornton。2003年。《人类肌肉衰老的基因表达剖析》《生理基因组学》14(2):149
–
59。
[0352]
wesolowska
‑
andersen、agata、martin iain bahl、vera carvalho、karsten kristiansen、thomas sicheritz
‑
pont
é
n、ramneek gupta和tine rask licht。2014年。《从粪便中提取细菌dna的方法之选择影响了元基因组分析所评估之群落结构》《微生物组》2(六月):19。
[0353]
wolters、stefanie和schumacher。2013年。《衰老和疾病中的基因组维护和转录完整性》《遗传学的前沿》4。https://doi.org/10.3389/fgene.2013.00019。
[0354]
zahn、jacob m.、suresh poosala、art b.owen、donald k.ingram、ana lustig、arnell carter、ashani t.weeraratna等学者。2007年。《agemap:小鼠衰老的基因表达数据库》。《plos遗传学》3(11):e201。