用于状态转换图的统计分析和预测建模的方法与流程

文档序号:29714537发布日期:2022-04-16 18:23阅读:218来源:国知局
用于状态转换图的统计分析和预测建模的方法与流程

1.本公开总体上涉及用于根据个体临床路径构建图形结构以支持临床表型或临床结果的预测建模的方法。


背景技术:

2.诊断和治疗路径的变化是当前医疗保健生态系统中众所周知的缺陷;处置具有相同患者简档的两个患者的两个医师仍然能够规定不同成本或结果的处置。目前,没有已知的数据驱动的个性化护理路径管理方法,部分地因为缺乏图形和/或数据结构来存储和关联历史路径数据,并且还缺乏适当的分析方法来利用此类结构。
3.此外,在基因组信息学中,下一代测序的关键阶段是对来自测序仪的读数进行二次分析。人类基因组的标准操作流程是对样本进行多路分解、与人类参考基因组对齐,并针对异常情况通过算法检查(例如,识别变体、种系测试、表达分析、融合分析等)。在对齐之后的所有发现取决于对齐的质量和参考基因组本身的质量。然而,其并不完美;其是基于少数个体共识的单个线性序列,并不体现人类群体中的序列的丰富多样性。这导致了若干实际问题,包括误对齐(读数映射到基因组上的错误位置)或未对齐(读数根本未映射),导致基因组的临床相关和高度可变区域的广泛不准确(假阳性、假阴性)。改进参考的最有希望(尽管相对较新)的方法是构建基因组图,其中,每个样本由图中的途径表示。基于图的结构将允许临床医师能够捕获和发现人类群体中基因型或单倍型的多样性-并且重要的是,复杂的基因型或单倍型-从而实现更准确的读数对齐。


技术实现要素:

4.下面给出各种示例实施例的简要概述。下面的概述中可能会有一些简化和省略,其目的在于突出显示和介绍各种示例实施例的一些方面,而不是限制本发明的范围。足以允许本领域普通技术人员做出和使用发明构思的示例实施例的详细描述将在后面的部分中进行。
5.各种实施例涉及一种用于构建用于处置、流程和进展工作流程的状态转换图的计算机实施的方法,其中,所述方法包括:由一个或多个计算设备获得包括患者群组的处置历史和临床数据的数据;并且由一个或多个计算设备使用患者群组的个体患者的处置历史和临床数据生成针对所述个体患者的个体处置路径;其中,使用用户定义的参数生成个体处置路径,用户定义的参数包括:一个或多个合格事件;针对一个或多个合格事件的一个或多个反应状态;以及一个或多个可逆或可折叠事件。该方法另外包括由一个或多个计算设备构建表示多个对齐和合并的个体处置路径的状态转换图,所述多个对齐和合并的个体处置路径包括一个或多个合格事件、针对一个或多个合格事件的一个或多个反应状态以及一个或多个可逆或可折叠事件。
6.各种实施例还涉及包括一个或多个处置方案的一个或多个合格事件,所述处置方案选自包括以下各项的组:药物方案、手术方案、符合条件的介入的集合或其组合。
7.各种实施例还涉及选自包括以下各项的组的一个或多个反应状态:处置后的反应状态和基于特定基因标志的患者的亚型。在各种实施例中,反应状态可以被链接到选自包括以下各项的组的一个或多个报告:临床报告、放射学报告、病理学报告、基因组学报告或其组合。
8.各种实施例还涉及构建步骤,包括将个体处置路径一次一个地添加到状态转换图。
9.各种实施例还涉及包括与类似性质的处置相对应的边的状态转换图,其中,边是可折叠的。
10.各种实施例还涉及构建一个或多个子图,该子图使用另外的用户定义的参数生成,所述另外的用户定义的参数包括:一个或多个合格事件、针对一个或多个合格事件的一个或多个反应状态;以及一个或多个可逆或可折叠事件。
11.各种实施例涉及一种用于处理处置和临床数据的系统,包括:用于存储算法的存储区;处理器,其被配置为实施算法以获得包括患者群组的处置历史和临床数据的数据;使用用户定义的参数,使用患者群组的个体患者的处置历史和临床数据生成针对所述个体患者的个体处置路径,所述用户定义的参数包括:一个或多个合格事件;针对一个或多个合格事件的一个或多个反应状态;以及一个或多个可逆或可折叠事件;并且构建表示多个对齐和合并的个体处置路径的状态转换图,所述多个对齐和合并的个体处置路径包括:一个或多个合格事件、针对一个或多个合格事件的一个或多个反应状态以及一个或多个可逆或可折叠事件。
12.各种实施例涉及一种用于处理处置和临床数据的系统,其中,处理器被配置为将个体处置路径一次一个地添加到状态转换图。
13.各种实施例涉及一种用于处理处置和临床数据的系统,其中,所述处理器被配置为将一个或多个反应状态链接到选自包括以下各项的组的一个或多个报告:临床报告、放射学报告、病理学报告、基因组学报告或其组合。
14.各种实施例还涉及一种存储指令的非瞬态机器可读介质,所述指令用于控制处理器以执行包括以下各项的操作:由一个或多个计算设备获得包括患者群组的处置历史和临床数据的数据;由一个或多个计算设备使用患者群组的个体患者的处置历史和临床数据生成针对所述个体患者的个体处置路径;其中,使用用户定义的参数生成个体处置路径,所述用户定义的参数包括一个或多个合格事件;针对一个或多个合格事件的一个或多个反应状态;以及一个或多个可逆或可折叠事件;并且由一个或多个计算设备构建状态转换图,所述状态转换图表示多个对齐和合并的个体处置路径,所述多个对齐和合并的个体处置路径包括一个或多个合格事件、针对一个或多个合格事件的一个或多个反应状态和一个或多个可逆或可折叠事件。
附图说明
15.在其中相似的附图标记贯穿单独的视图指代相同或功能相似的元件的附图连同下面的详细描述被并入说明书并形成说明书的一部分,并且用于进一步图示在权利要求中发现的概念的示例实施例并解释那些实施例的各种原理和优点。
16.这些和其他更详细和具体的特征在以下说明书中更充分地公开,参考附图,其中:
17.图1图示了概括可能的处置途径和对应的状态转换的处置-事件状态转换图的实施例;
18.图2图示了概括用于基因组分析的基因组坐标范围的状态转换子图的实施例;
19.图3图示了通过三个路径的对齐和合并来构建状态转换图的示例;并且
20.图4图示了已经满足肝移植米兰准则(milan criteria)的hcc患者的处置图的示例。
具体实施方式
21.应当理解,附图仅仅是示意性的并且没有按比例绘制。还应该理解的是,贯穿附图使用相同的附图标记来指示相同或相似的部分。
22.描述和附图说明了各种示例实施例的原理。因此将意识到,本领域的技术人员将能够设计出各种布置,尽管本文没有明确地描述或示出,但所述布置体现了本发明的原理并且被包括在其范围内。此外,本文中列举的所有示例原则上明确地旨在是为了教学目的,以帮助读者理解本发明的原理和由(一个或多个)发明人对促进本领域所贡献的概念,并且应被解释为不限于这样的具体列举的示例和状况。此外,如本文所使用的术语“或”指非排他性的或(即,和/或),除非另行指示(例如,“否则”或“或在备选方案中”)。而且,本文描述的各种示例实施例不一定是相互排斥的,因为一些示例实施例可以与一个或多个其他示例实施例组合以形成新的示例实施例。诸如“第一”、“第二”、“第三”等的描述符并不意味着限制所讨论的元素的顺序,被用于将一个元素与下一元素区分,并且通常是可互换的。诸如最大值或最小值的值可以被预先确定并且基于应用被设置为不同的值。
23.状态转换图可以用于有效地汇总和可视化历史患者数据,包括疾病状态、处置反应和个体患者群组的其他元数据,并且可以支持通过下游数据分析来探索和发现处置和结果之间的趋势和关联。这可以使得能够建立统计模型,其利用该数据进行汇总研究,例如,某些药物或处置过程的有效性,或针对诸如特定临床结果、成本和最小副作用的变量优化的个体患者的路径指导。
24.本文中的示例实施例描述了被配置为构建优化用于临床表型或结果的预测性建模中的图形结构的系统。示例实施例还描述了用于构建实现临床表型或结果的基于图的预测建模的图形结构的方法。在各种实施例中,图形结构可以包括状态转换图,其可以用于概括处置/流程工作流程、疾病进展事件(例如,肿瘤中的突变/克隆进化、症状旅程等)、基因组单倍型的组合(在基于图的基因组中)或个体样本的其他信息。在各种实施例中,对图的计算分析与个体样本的临床数据(例如疾病状态和处置反应)一起还可以允许构建统计模型以推断疾病状态和进展以及临床结果,或通过预测用于优化结果的最佳临床路径来指导处置规划。
25.在各种实施例中,使用本公开的方法构建的状态转换图包括临床状态转换图,其通过适当对齐和合并个体处置路径来概括患者群组的处置数据。在各种实施例中,可以通过个体处置路径的适当对齐和合并来从患者群组的时间戳记的处置历史和临床数据构建状态转换图。在其他实施例中,状态转换图可用于其他领域,例如物流和操作。
26.在各种实施例中,状态转换图可以绘制事件的年表。在各种实施例中,事件的年表可以包括所应用的处置、逻辑流程或有害突变的出现,并且可以由图中导致个体从第一反
应状态转变到第二反应状态的有向边表示。额外的事件,例如成本、药物毒性等,可以分配给每个边,以允许基于累积成本、最大药物毒性和本领域技术人员已知的其他相关量度对路径进行排序。在各种实施例中,反应状态可以被用于概括瞬态总体状况。示例性反应状态包括个体样本的治疗反应和临床观察和症状,并且可以由图中的顶点表示。
27.在各种实施例中,系统然后可以被配置为通过一次添加一个患者路径来为所有采样的患者生成组合转换图。患者路径可以以不同方式对齐。在一个实施例中,首先在新患者样本中识别最大可能的状态-事件-状态单元序列,该新患者样本可以基于用户定义的相似性准则和量度与组合图匹配。在各种实施例中,用户可以定义等效反应状态和事件的集合,或者它们的等效性的规则和条件。例如,对应于类似性质的处置的事件边可以设置为等效的,以简化图并提高检测与聚合组中更多患者样本的临床关联的能力。此外,用户可以定义多个特定的事件和状态序列,以及其用作添加新样本的锚点的优先级。然后可以以这样的方式添加样本患者路径:得到的图具有最少数量的额外反应状态和边并且保持非循环(无反向转换)。对于每个个体患者,反应状态能够与临床、放射学、病理学和基因组学报告以及该反应状态下的电子健康记录中的一个或组合相关联。
28.在各种实施例中,与每个反应状态相关联的临床数据可以实现更复杂的下游查询或分析。在各种实施例中,本公开的系统和方法可以包括被配置为将在研究中的性状与统计测试匹配的算法。
29.在各种实施例中,通过分析与边相关的所有样本,用户可以评价每个边(例如基因组变体)或一组边(例如具有不同输入和输出状态的处置流程)对不同分类/定量性状、治疗反应、临床结果或其他计算的度量和标签的潜在影响。在各种实施例中,用户可以决定是研究在合格事件之后立即出现的效果(例如,在处置后立即在临床测试中报告的反应状态),还是在一段时间内/之后或在某数量的转换过程中出现的效果。在各种实施例中,用户还可以选择对一组边(例如一系列药物施用)应用统计评价,以研究它们的总体效果。在本公开的系统的各种实施例中,基于在研究中的表型/结果变量的性质,例如静态/动态、分类/定量,本公开的系统还可以被配置为自动建议/应用如本文所述的适当的统计测试。
30.在一些实施例中,研究中的边的组包括静态分类性状。在各种实施例中,静态分类性状可以是回顾性的,其中,每个样本的其值可以沿途径保持相同,例如疾病状态,并且静态分类性状可以有k个分类值类别_i。对于这样的静态分类性状,可以通过比较通过边/途径选择之前和之后类别的分布来评价边/途径的影响。在各种实施例中,这可以通过首先计算列联表(表1)来完成,该列联表概括了选择之前和之后每个类别中的样本数量(mi,ni)。
31.表1
[0032][0033]
根据要回答的问题,可以基于列联表计算不同的度量和关联测试,以用于边/途径对静态分类性状的影响的评价。
[0034]
在各种实施例中,用于静态分类性状的评价的合适度量和关联测试包括相对风险(rr)测试、优势比(or)、卡方独立性检验、费舍尔(fisher)精确独立性检验。在本公开的系统的各种实施例中,系统可以被配置为自动建议或应用适当的度量和关联测试以用于静态分类性状的最佳评价。
[0035]
在一些实施例中,可以建议和应用相对风险(rr)测试。在该实施例中,针对每个类别i,可以基于所有样本或类别的指定子集的样本来计算相对风险rri。参考列联表1,如果其基于所有样本,则
[0036][0037]
如果其基于类别s的指定子集,则
[0038][0039]
在一些实施例中,可以建议和应用优势比(or)测试。在该实施例中,针对每个类别i,可以基于所有样本或类别的指定子集的样本来计算优势比ori。参考列联表1,如果其基于所有样本,则
[0040][0041]
如果其基于类别s的指定子集,则
[0042][0043]
在一些实施例中,可以建议和应用卡方独立性检验。在一些实施例中,可以应用卡方独立性检验来测试性状完全独立于边/途径的可能性有多大。参考列联表1,卡方统计由下式给出:
[0044][0045]
然后可以基于具有(k-1)个自由度的卡方分布计算p值。在各种实施例中,卡方检验可以最好地应用于大样本量,例如,每个类别中的预期数量》5。此外,在具有较小样本量的各种实施例中,yates(针对一个自由度)或williams校正可以自动应用于改进的准确性。
[0046]
在一些实施例中,可以建议和应用费舍尔精确独立性检验。在该实施例中,费舍尔精确独立性检验以更高的计算成本返回精确p值,并且最好应用于小样本量。在各种实施例中,费舍尔精确独立性检验可以推广到更高维的表,例如,使用freeman-halton扩展。在其他实施例中,费舍尔精确独立性检验可以作为一次比较两个类别的多个测试来执行。根据目的,用户可以将测试应用于所有可能的类别对或可能的类别对的子集。在各种实施例中,还可以将一个类别与汇集在一起的其余样本进行比较,或在任何两个组之间进行比较,每个组包括多个类别的池。在各种实施例中,然后可以通过个体比较的p值的最小值给出总体p值,使用诸如bonferroni和错误发现率(fdr)调节的方法对多重测试进行校正。在一个实施例中,对于类别_1的增加的选定样本数量,单尾费舍尔精确检验(k=2)的p值由下式给出:
[0047]
[0048]
其中,是二项式系数。
[0049]
在各种实施例中,研究中的边的组可以包括动态分类性状。在各种实施例中,研究中的动态分类性状可以是纵向的,并且其在样本中的值可以在遍历了边之后改变,例如,高/低血压,并且该性状具有k个分类值类别_i。对于这种动态分类性状,可以通过比较移动进出每个类别的样本数量来评价边/途径的影响。这可以通过首先计算列联表(表2)来完成,该列联表概括了保留在类别i(m
ii
)中的样本数量,或者在遍历边/途径后从类别i变为类别j(m
ij
)。
[0050]
表2
[0051][0052]
在各种实施例中,列联表可以被配置为示出在遍历边/途径之后保留在一个类别(主对角线)中或从一个类别(行)切换到另一个(列)的样本数量。根据要回答的问题,可以基于列联表计算不同的度量和关联测试,以用于边/途径对动态分类性状的影响的评价。
[0053]
在各种实施例中,用于动态分类性状的评价的合适度量和关联测试包括mcnemar边际分布同质性检验等。在本公开的系统的各种实施例中,系统可以被配置为自动建议或应用适当的度量和关联测试以用于动态分类性状的最佳评价。
[0054]
在各种实施例中,列联表可以通过首先测量输出样本的数量/分数来计算。在一个实施例中,计算输出样本的数量/分数以测量从类别_i变为其他类别的样本的数量/分数:n_出i=r
i-m
ii
和f_出i=(r
i-m
ii
)/ri。
[0055]
在各种实施例中,可通过测量传入样本的数量/分数来计算列联表。在一个实施例中,计算传入样本的数量/分数以测量从所有其他类别变为类别_i的样本的数量/分数:n_入i=c
i-m
ii
和f_入i=(c
i-m
ii
)/(n-ri)。
[0056]
在各种实施例中,可以通过测量额外样本的数量/分数来计算列联表。在一个实施例中,计算额外样本的数量/分数以测量类别_i中样本的数量/分数的总体增加:n_addi=c
i-ri和f_addi=(c
i-ri)/ri。
[0057]
在一个实施例中,可以建议和应用mcnemar边际分布同质性检验。在行总数中的每个等于对应的列总数(即每个类别中的样本数量在转换之前和之后保持不变)时发生边际同质性。尽管最初是针对2x2列联表设计的,但广义mcnemar/stuart-maxwell检验或bhapkar检验可以处理更高维度的表。在另一个实施例中,可以执行一次对两个类别进行比较的多个测试。根据目的,用户可以将测试应用于所有可能的类别对或可能的类别对的子集。也可以将一个类别与汇集在一起的其余样本进行比较,或者在任何两组之间进行比较,每个组包括多个类别的池。然后可以通过个体比较的p值的最小值给出总体p值,使用诸如
bonferroni和错误发现率(fdr)调节的方法对多重测试进行校正。在各种实施例中,mcnemar检验统计(k=2)可以由下式给出:
[0058][0059]
在各种实施例中,可以基于具有1个自由度的卡方分布来计算p值。在各种实施例中,对于较小的样本量,连续性校正可以自动应用于改进的准确性。
[0060]
在各种实施例中,研究中的边的组可以包括静态定量性状。在各种实施中,静态定量性状可以是回顾性的,其中,其值是定量的并且对于沿途径的每个样本保持相同,例如总体存活率。对于这种静态定量性状,可以通过检查通过边/途径选择之前和之后样本均值是否显著变化来评价边/途径的影响。在各种实施例中,目标可以是测试从有限群体中随机选择样本而不进行替换的零假设。
[0061]
在各种实施例中,定量性状遵循在选择前的n个样本中具有均值μ和标准偏差σ的正态分布。在该实施例中,可以通过边/途径来选择n《n个样本,并且选定样本的子集可以提供均值在各种实施例中,整体影响可以通过选择之前和之后的样本均值差异来测量。在各种实施例中,可以应用有限群体校正因子fpc=√((n-n)/(n-1))。在这样的实施例中,选定样本的均值的标准偏差变为:
[0062][0063]
两侧p值可以由下式给出:
[0064][0065]
在各种实施例中,研究中的边的组可以包括动态定量性状。在各种实施方案中,动态定量性状可以是纵向的,其中,其值是定量的并且可以在遍历边之后针对每个样本而改变,例如血糖水平。对于这种动态定量性状,可以通过检查所有样本中的定量性状的值是否倾向于增加或减少来评价边/途径的影响。在各种实施例中,目标可以是测试零假设:在每个样本中的边/途径之前和之后观察到的性状值的均值差异为零。
[0066]
在一些实施例中,可以建议和应用配对样本的相关t检验。在一个实施例中,定量性状跟随正态分布。在该实施例中,有n个样本,每个样本在测试中的边/路径之前和之后具有一对观察到的性状值,其中,和sd分别是每个样本的观察到的性状值之间的成对差异的平均和标准偏差。在各种实施例中,t统计可以由下式给出:
[0067][0068]
其中,μ0是性状的预期平均差异。尽管整体影响可以通过测量,但关联的强度可以由基于具有(n-1)自由度的t分布计算的p值来支持:
[0069]
p=2
·
pr(t》|t|),
[0070]
对于双尾检验,
[0071]
p=pr(t》t),
[0072]
对于下尾检验(备选假设的增加的性状值),并且
[0073]
p=pr(t《t),
[0074]
对于低尾检验(备选假设的降低的性状值)。
[0075]
在各种实施例中,由顶点和边的集合形成的本公开的图形结构可以用于有效地表示跨一个或多个群组和群体的个体基因组的变异的序列。在各种实施例中,基因组图可以被用于考虑不同类型的基因组变体,包括snv、插入缺失、单倍型和结构变体。在一些实施例中,图构建方法可以用于通过创建cnv图并包括对疾病具有显著效果的cnv作为模型中的额外元素来表示拷贝数变异(cnv)。在各种实施例中,本公开的方法可以被用于帮助研究中长程基因组结构在复杂区域(例如主要组织相容性复合体(mhc))中的影响,揭示针对复杂病症的分散在基因组上的许多弱至中度遗传因子,并汇总它们对疾病风险评价的影响,并为全基因组测序(wgs)数据的分析提供解决方案,其主要覆盖具有有限注释的基因间区域。
[0076]
在使用中,本公开的系统可以被配置为首先使用用户定义的参数生成针对患者群组的个体处置路径。示例性用户定义的参数可以包括符合边或转变的事件的类型和类别,例如,施用于患者的特定药物集合、手术、符合条件的介入的集合等。示例性用户定义的参数另外包括用于分裂反应状态的标准,例如通过立即反应状态,例如完全/部分/无反应、处置后、基于特定基因标志的患者的亚型等。在一些实施例中,用户定义的参数可以包括完全由施用的处置的序列定义的转换图,其中,不需要用于分裂反应状态的准则。示例性用户定义的参数还可以包括可逆或可折叠事件的列表,其中,两个或更多个连续事件的顺序无关紧要并且可以折叠成一个组合事件以简化路径。在各种实施例中,用户定义的参数还可以包括额外事件的列表,其可以被折叠/合并以进一步简化路径和图。
[0077]
在各种实施例中,合适的可折叠事件可以包括用于增加样本总数的相似交叠边,从而改进用于检测与表型/结果的关联的统计能力。在各种实施例中,边相似性可以由诸如基因组变异图的单倍型相似性评分或状态转换图的处置类别的值来定义。在各种实施例中,如果相似边对表型/结果的效果在相同方向并且所得的p值或效果量度比个体边强,则可以合并相似边。合适的可折叠事件还可以包括连续边,其中,遍历第二边的所有样本与一个或多个先前边完全交叠,并且第二边不会导致任何样本的状态的任何改变。合适的可折叠事件还可以包括具有相同或高度相似的样本状态的相邻节点以及对表型/结果具有不显著影响的其他连接边。
[0078]
在一些实施例中,利用针对个体边计算的统计量度,可以通过聚合关联边的统计证据来评价基因组的总体疾病风险或朝向有利处置结果的临床路径的有效性。在一个实施例中,可以计算与疾病/结果显著相关联的基因组/路径所遍历的边的数量。
[0079]
图1图示了概括可能的处置途径和对应的反应状态转变的处置图100。处置图100可以首先示出处于第一反应状态110中的患者,其中,第一处置a或第二处置b的施用可以示出为导致向第二反应状态120或第三反应状态130的转变。处置图100可以另外示出第三处置c的效果,第三处置c当被施用于处于第二反应状态120中的患者时导致向第四反应状态140的转变。处置图100还可以示出第四处置d的效果,第四处置d当被施用于处于第二反应状态120或第三反应状态130中的患者时导致向第五反应状态150或第六反应状态160的转变。处置图100还可以示出第五处置e的效果,第五处置e当被施用于处于第四反应状态140中的患者时导致向第七反应状态170的转变。处置图100还可以示出处置f的效果,处置f当被施用于处于第五反应状态150中的患者导致向第七反应状态170或第八反应状态180的转变,以及示出处置g的效果,处置g当被施用于处于第六反应状态160中的患者时导致向第八反应状态180的转变。
[0080]
在各种实施例中,处置图100可以包括一系列子图。在各种实施例中,可以使用反应状态和转换准则来选择子图。在各种实施例中,用户可以通过以下来将基于图的分析限制到子图:通过具有对导航和用户交互的支持的可视化图的用户接口手动选择区域,或者通过输入选择准则。在各种实施例中,本公开的状态转换图可以被配置为允许用户在路径的开始、中间或朝向结束时选择满足特定反应状态/转换准则的子图。在一些实施例中,用户可以选择具有以下途径的子图:从特定类型的新辅助化疗开始,然后是手术,然后是中间的完全缓解状态和结束时的复发状态。
[0081]
在各种实施例中,基于用户定义的公式,可以针对选定子图内的每个样本计算不同的度量,例如总处置成本、最大药物毒性水平、副作用的总体严重性、处置过程期间血压和葡萄糖水平的均值和标准偏差等。在各种实施例中,用户还可以基于度量和选择准则的组合为每个样本创建额外分类标签。然后可以将样本度量和标签用于下游分析。
[0082]
在各种实施例中,本公开的方法还允许用户通过基于一般人口统计学(例如,性别和种族)、临床数据(例如,诊断年龄、吸烟状况、总体存活率等)的定义准则、计算的度量和标签或样本id来选择样本。在各种实施例中,该方法允许通过去除未被任何选定患者样本遍历的边来简化子图。
[0083]
图2示出了部分基因组变异图的示例。可以应用关于边(其在这种情况下表示基因组变异)对表型或疾病状态的影响的上述统计分析技术。
[0084]
图3图示了根据三个样本路径构建状态转换图300的示例。如图3所示,全局状态a-h和a'由圆圈表示,而转换t1-t6和t1'由箭头表示。状态a和a',以及转换t1和t1'可以由用户定义为等效的。在各种实施例中,可以通过一次添加一个路径来逐步构建图,其中,在图和新患者样本之间的匹配单元310、320被识别为锚点。得到的状态转换图300也可以以如下所示的表格式来表示,其概括了每个边的传入反应状态、输出反应状态、转换事件和遍历路径。
[0085]
传入状态输出状态转换事件路径a/a

bt1/t1

p1,p3bct2p1,p2cdt3p1,p2det4p1eft5p1gbt6p2dht4p2hft5p2,p3bht4p3
[0086]
示例1
[0087]
建立转换图
[0088]
在癌症中心需要状态转换图来评价它们现有和未来的hcc患者的最有效和最不有效的处置线。该中心期望建立所有患者的综合图,并根据疾病的各种阶段将图分裂成子图。
[0089]
在建立图时,由临床医师将以下事件指定为转换:
[0090]
i)经动脉化疗栓塞术(tace);
[0091]
ii)带有药物洗脱微珠的tace(deb-tace);
[0092]
iii)靶向全身化疗(索拉非尼(sorafenib)、舒尼替尼(sunitinib)、利尼伐尼(linifanib)、布立尼布(brivanib)、c-met抑制剂(tivantinib)、依维莫司);
[0093]
iv)化疗和tace联合处置(索拉非尼+tace);
[0094]
v)放射栓塞术;
[0095]
vi)化疗和放射栓塞联合处置(索拉非尼+放射栓塞);
[0096]
vii)经皮乙醇注射(pei);
[0097]
viii)冷冻消融;
[0098]
ix)射频消融(rfa);
[0099]
x)手术切除(部分肝切除术);
[0100]
xi)肝移植。
[0101]
临床医师提供了在每个转换之间分裂反应状态的准则。一般来说,治疗指导的任何临床测量结果或中间结果,例如米兰准则(评价肝硬化/hcc患者是否适合肝移植)、药物反应和转移的发生,都可以用作分裂状态的准则。
[0102]
完全定义转换和状态后,从中心的电子健康记录(ehr)中检索患者处置和结果数据,并由处理器按照规范构建图。由于癌症中心希望评价处置效果,因此可以使用以下一种或多种分类或度量进行关联分析:
[0103]
i)完整反应;
[0104]
ii)客观反应;
[0105]
iii)5年无复发存活;
[0106]
iv)5年总存活;
[0107]
v)平均肿瘤大小。
[0108]
示例2
[0109]
用于下游分析的子图选择
[0110]
利用示例1中形成的状态转换图,癌症中心想要评价等待肝移植的患者的结果与随访。近年来,肝移植(lt)等待时间增加,导致患者因肿瘤进展而退出,因此降期,跟随有最短观察期是将患者保持在等待名单上的标准实践(即必须满足米兰准则)。代替于分析整个图,准则应该应用于将分析限制到选定的患者子集。
[0111]
图4示出了满足肝移植的米兰准则的hcc患者的处置图。三个子集的患者首先利用pei、tace和rfa处置。利用tace和rfa处置的患者维持米兰准则;然而,利用pei处置的患者经历肿瘤进展,并且不再有资格。在那些不再对lt有资格的患者中,一个子集利用依维莫司处置但没有经历反应。该子集继续进行下一次干预(未示出)。另一个子集用索拉非尼处置;这些患者经历病理完全缓解(pcr)。在那些用tace/rfa满足米兰准则的患者中,一个子集找到了供体并接受了lt,从而得到针对整个子集的pcr。其余满足米兰准则的tace/rfa患者,在等待列表上的时间足够长,以至于施用切除以将其保持有资格。在这些患者中,都继续获得lt,从而得到pcr。
[0112]
示例3
[0113]
使用基因组图进行单倍型检测
[0114]
在该示例中,临床医师试图评估患者是否有患上1型糖尿病的风险。尽管该疾病的
确切原因尚不清楚,但已知若干人类白细胞抗原(hla)基因中的某些变体会增加生命后期发展的风险。不是特别是任何一种变体,而是某些组合或单倍型是疾病最终发作的风险指示符。hla区域的独特之处在于它即使在健康群体中也具有高度可变性,从而导致复杂且很大程度上未知的单倍型。
[0115]
从预先构建和子集化的(对于hla区域)基因组变异图,临床医师首先选择一个子图,其包含样本群组,其表示已确诊和未确诊1型糖尿病的患者,目标是识别与目标患者最接近匹配的(一个或多个)单倍型。随后,临床医师选择将分析限制到6号染色体的hla区域,不包括基因组其他部分的边。然后,临床医师设置95%的单倍型相似性阈值,并且相似的边被折叠在一起,目的是改进关联测试的统计能力,具有每个边的更大样本数量。接下来,系统计算每个边的经调节的p值,以检测它们与1型糖尿病的关联,并找到对分析最显著的那些。
[0116]
示例4
[0117]
使用处置图进行处置规划和结果优化
[0118]
在该示例中,临床医师想要为患有高危前列腺癌的患者识别未来的最佳护理计划,并且想要针对肿瘤尺寸减小而优化的护理计划。为了应用状态转换推断的方法,首先将统计框架应用于前列腺癌的状态转换图。最初,临床医师选择患者群组来填充高危前列腺癌状态转换子图。该群组是基于目标患者共享的一组属性选择的,根据临床医师自己感知的重要性和优化目标:诊断、疾病阶段、人口统计等。该群组没有过度限制,以保持统计能力以及包括用于产生最佳模型的各种回顾性临床路径和结果。
[0119]
一旦选择了子图,就在处置图中识别出与目标患者的当前状态相匹配的若干起点。临床医师选择一个这样的起点(反应状态),其与目标患者的当前状态相匹配,其中,必须决定初始处置。在这种状态之后是被引到多种结果状态的多个边(表示多种处置),从而指示一些治疗证明比群组中的其他处置更有效。一个这样的边,边a,与根治性外部射束放射治疗的施用相对应;第二个边,边b,与雄激素剥夺疗法(adt)的施用相对应;第三个边,边c,与adt的施用和随后的外部射束放射治疗相对应。随后的排序方法用于告知临床医师沿每个边的患者的结果;临床医师认为根据所选择的排序方法,边c将可能具有最佳结果,并决定对患者施用adt和外部束放射治疗。
[0120]
示例5
[0121]
保险公司风险评估、治疗效果
[0122]
保险公司想要为保单持有人计算新的保费率。为了计算保费率并保持利润,保险承保人希望评价新保单持有人将对保险单提出索赔的风险。人寿保险承保人正在计算新客户保单的保费率。除其他信息外,承保人具有对个体的健康史的访问权,并想要评价客户(或客户的家人)在未来30年内针对保单提出索赔的几率。承保人还具有对保险公司以前和当前客户的历史索赔和健康历史数据的状态转换图的访问权。承保人选择与患者人口统计相匹配的客户群组。然后,系统将客户的途径分为两类;那些在30年内提出索赔的客户和那些没有提出索赔的客户。计算每个类别的优势比,并且发现新客户在未来30年内最可能不会提出索赔,并且承保人随后选择向新客户呈现更便宜的保费率。
[0123]
技术创新
[0124]
目前不存在用于确定个性化护理路径管理的已知数据驱动方法,部分因为缺乏用
于存储和关联历史路径数据的数据结构以及缺乏适当的分析方法来利用它。本文描述的图形结构有效地聚合和可视化历史患者数据参数,以允许通过下游分析探索和发现处置与结果之间的趋势和关联。本文描述的图形结构还使得能够计算统计模型,其利用数据进行汇总研究,例如,关于某些药物或处置过程的有效性,或针对诸如特定临床结果、成本和最小副作用的变量优化的个体患者的路径指导。
[0125]
尽管实施例的一个或多个特征可以涉及数学公式的使用,但实施例决不仅限于数学公式。它们也不是针对组织人类活动或心理过程的方法。相反,由实施例所采取的复杂和特定的方法,结合所执行的信息处理量,否定了实施例由人类活动或心理过程执行的可能性。此外,尽管可以使用计算机或其他形式的处理器来实施实施例的一个或多个特征,但是实施例不仅针对使用计算机作为工具来以其他方式执行先前手动执行的过程。
[0126]
这些实施例也不先占做出处置决定的一般概念。相反,本文公开的实施例采用特定的方法(例如,通过事件日志、跟踪集、聚类算法以及加权和距离测量模型)来解决不先占分配医疗保健资源或以其他方式限制公众实践分配医疗保健资源的一般概念的技术问题。
[0127]
本文描述的方法、过程和/或操作可以由计算机、处理器、控制器或其他信号处理设备执行的代码或指令来执行。根据一个或多个实施例,代码或指令可以存储在非瞬态计算机可读介质中。由于详细描述了形成方法(或计算机、处理器、控制器或其他信号处理设备的操作)的基础的算法,用于实施方法实施例的操作的代码或指令可以将计算机、处理器、控制器或其他信号处理设备变换成用于执行本文的方法的专用处理器。
[0128]
本文公开的实施例的模块、阶段、模型、处理器和其他信息生成、处理和计算特征可以以例如可以包括硬件、软件或两者的逻辑来实施。当至少部分地以硬件实施时,模块、模型、引擎、处理器和其他信息生成、处理或计算特征可以是例如各种集成电路中的任何一种,包括但不限于专用于应用的集成电路、现场可编程门阵列、逻辑门的组合、片上系统、微处理器或其他类型的处理或控制电路。
[0129]
当至少部分地以软件实施时,模块、模型、引擎、处理器和其他信息生成、处理或计算特征可以包括例如用于存储代码或指令以供例如计算机、处理器、微处理器、控制器或其他信号处理设备执行的存储器或其他存储设备。由于详细描述了形成方法(或计算机、处理器、微处理器、控制器或其他信号处理设备的操作)的基础的算法,用于实施方法实施例的操作的代码或指令可以将计算机、处理器、控制器或其他信号处理设备变换成用于执行本文的方法的专用处理器。
[0130]
从前面的描述应当显而易见,本发明的各种示例性实施例可以在硬件中实施。此外,各种示例性实施例可以实施为存储在诸如易失性或非易失性存储器的非瞬态机器可读存储介质上的指令,该指令可以由至少一个处理器读取和执行以执行本文详细描述的操作。非瞬态机器可读存储介质可以包括用于以机器可读的形式存储信息的任何机制,所述机器诸如为个人或膝上型计算机、服务器或其他计算设备。因此,非瞬态机器可读存储介质可以包括只读存储器(rom)、随机存取存储器(ram)、磁盘存储介质、光存储介质、闪存设备和类似的存储介质,并且不包括瞬态信号。
[0131]
本领域技术人员应当意识到,本文中的任何框和框图表示体现本发明原理的说明性电路的概念视图。特定框的实施方式可以变化,而它们可以在硬件或软件域中实施而不限制本发明的范围。类似地,将意识到,任何流程图、流图、状态转换图、伪代码等表示可以
基本上在机器可读介质中表示并且因此由计算机或处理器执行的各种过程,无论这种计算机或处理器是否被明确示出。
[0132]
因此,应理解,以上描述旨在是说明性的而不是限制性的。在阅读以上描述时,除了所提供的示例之外的许多实施例和应用将是显而易见的。范围应该不参考以上描述或下面的摘要来确定,而是应该参考所附权利要求以及这些权利要求所享有的等价物的全部范围来确定。预期并打算在本文讨论的技术中发生未来的发展,并且所公开的系统和方法将被并入到这样的未来实施例中。综上所述,应该理解本技术能够改和变化。
[0133]
益处、优势、问题的解决方案以及可能导致任何益处、优势或解决方案出现或变得更加明显的(一个或多个)任何元素不应被解释为任何或所有权利要求的关键的、所需的或必要的特征或元素。本发明仅由所附权利要求限定,包括在本技术未决期间作出的任何修改以及所发布的那些权利要求的所有等同物。
[0134]
权利要求中使用的所有术语旨在被给予它们最广泛的合理结构和它们的通常含义,如本文所述技术的技术人员所理解的,除非在本文中做出相反的明确指示。特别地,除非权利要求记载了相反的明确限制,否则应将诸如“一个”、“该”、“所述”的单数词语的使用理解为列举一个或多个所指示的元素。
[0135]
提供公开的摘要以允许读者快速确定技术公开的性质。提交的理解是它不会被用来解释或限制权利要求的范围或含义。此外,在上述详细描述中,可以看出,在各种实施例中各种特征被组在一起以用于简化本公开的目的。该公开方法不应被解释为反映所要求保护的实施例需要比每个权利要求中明确列举的更多特征的意图。相反,如以下权利要求反映的,发明主题在于少于单个公开的实施例的所有特征。因此,以下权利要求在此并入到详细描述中,每个权利要求作为单独要求保护的主题独立存在。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1