本申请要求于2015年7月16日提交的标题为“Systems and Methods for Process Design and Analysis”的美国专利申请号14/801,650的优先权,所述申请要求2014年8月1日提交的标题为“Computer-Implemented Method for Recording and Analyzing Scientific Test Procedures and Data”美国临时申请号62/032,217以及2015年6月25日提交的标题为“Computer-Implemented Method for Recording and Analyzing Scientific Test Procedures and Data”的美国临时申请号62/184,556的优先权,所述申请中的每一个均以引用的方式并入本文。
技术领域
本公开总体涉及用于对导致分析信息或产品的过程的过程设计和分析的系统和方法。
背景
大范围的产品的研究和制造依赖于多阶段过程,仅举几个例子,所述产品包括生物制品、药物、机械装置、电气装置以及食品。遗憾的是,此类过程通常具有许多变化源。虽然这些源中的大多数是次要的并且可以忽略,但是主要的变化源可能不利地影响此类过程的效率或甚至可行性。然而,如果确定可以采用去除这些主要变化源的资源,并且潜在地可以采用所述资源,则可以去除、最小化或包含此类主要变化源。一旦解决了这些主要变化源,过程可以被认为是稳定的。当过程稳定时,其变化应保持在已知的极限集合内。也就是说,所述保持至少直到出现另一个可分配的变化源。例如,洗衣皂包装生产线可设计成用十四盎司的洗衣皂填充每个洗衣皂盒子。一些盒子将具有略微超过十四盎司,而一些将具有略微少于十四盎司。当测量包装重量时,数据将显示净重的分布。如果生产过程、其输入或其环境(例如,生产线上的机器)改变,则数据的分布将改变。例如,当机械的凸轮和滑轮磨损时,洗衣皂填充机可能将超过指定量的肥皂放入每个盒子中。虽然这可能有利于客户,但是从制造商的角度来看,这是浪费的并且增加了生产成本。如果制造商及时找到变化和其来源,则可以纠正变化(例如,更换凸轮和滑轮)。
虽然标识过程的变化在理论上是好的,但是在实践中,找到这种变化存在许多障碍。大多数过程组合了许多不同的功能组件,每个组件具有它们自己的数据形式和错误类型。例如,使用细胞培养制造合成化合物的过程组合了化学组件、生物组件、发酵组件和工业设备组件。这些组件中的每一个涉及不同的量化单位、测量单位和误差单位。因此,用于开发和稳定过程的速率限制步骤不是开发此类过程中使用的算法;它是在此类过程中采集数据并将所述数据置于上下文之中。这需要跨越许多不同的系统和功能的数据聚合和再现性评估,以使得科学推理基于可再现的数据,而不是基于噪声和不确定性的假象。常规系统不能提供足够的能力以用于这种分析。他们专注于存储文件和数据,而不提供结构、上下文或灵活性,以实现实时分析和对用户的反馈。
例如,电子实验室笔记本(ELN)基本上是“玻璃上的纸(paper on glass)”,并且没有足够的能力来简化跨研究的纵向分析。实验室信息管理系统(LIMS)专注于样本数据收集,但不提供协议或研究环境以促进分析,也不提供“即时”适应不断变化的工作流程的灵活性,以及通常在过程中找到的许多不同的功能。因此,协议与结果之间的关系仍然不清楚,或甚至无法获得,并且信息系统成为制度政策规定的旧工作的“死”档案,而不是推动过程稳定化的资产。
因此,每年损失数十亿美元的物质和生命科学研究,这些研究不稳定,并且因此具有不令人满意的再现性速率。此外,在过程转移到制造期间,数百万美元的故障的发生率仍然很高。因此,考虑到以上背景,本领域中需要改进的系统和方法用于对导致过程稳定化的过程的过程设计和分析。
概述
所公开的实施方案解决了本领域中对用于稳定导致分析信息或产品的过程的改进的系统和方法的需要。如本文所用,术语“产品”是指例如有形产品,诸如材料、组合物、成分、药品、散装材料等;并且术语“分析信息”是指例如描述材料、设备或过程设置的测量值的类别或定量数据。所公开的系统和方法有利地且独特地减少了从研究和开发到制造的实验噪声和协作摩擦。所公开的系统和方法促进了数据相对于实验过程的演变图的可视化,以突出质量问题和机会,暴露跨时间、实验和团队的趋势和因果关系,刺激实验和过程质量的协作改进,并且稳定过程。
所公开的系统和方法维持具有关于一个或多个过程的一个或多个版本的超图数据存储。过程的版本包括具有节点、过程的阶段以及边缘的超图。阶段具有与阶段输入特性和输入规格极限相关联的参数化资源输入。阶段具有带有输出特性和输出规格极限的资源输出。边缘将节点的输出链接到其他节点的输入,从而表示资源从输出到输入的预期或实际转移。
所公开的系统和方法还维持具有多个过程运行的运行数据存储。每个过程运行标识过程版本、对应过程的超图中的第一节点的输入的值、它们的输入特性、第一节点的资源输出以及资源输出的输出特性的获得值。当查询标识存在于运行数据存储中的一个或多个输入和/或输出时,所述一个或多个输入和/或输出被格式化以用于分析。
既然已经概述了所公开的系统和方法的一般概述,将呈现所公开的系统和方法的更具体的实施方案。
本公开的一个方面提供了一种用于提供对一个或多个过程的过程设计和分析的非暂时性计算机可读存储介质。所述一个或多个过程中的每个过程导致相应的产品。所述非暂时性计算机可读存储介质存储指令,所述指令在由第一装置执行时致使第一装置维持超图数据存储、运行数据存储和统计模块。
对于所述一个或多个过程中的每个相应过程,超图数据存储包括相应过程的相应多个版本。每个相应的版本包括超图,所述超图包括通过多个边缘中的边缘连接的多个节点。所述多个节点中的每个相应节点包括表示对应过程中的相应阶段的过程阶段标签。此外,每个节点与对应过程中的相应阶段的参数化资源输入集合相关联。在一些实施方案中,所述参数化资源输入集合中的至少一个参数化资源输入与一个或多个输入特性相关联。在一些实施方案中,这一个或多个输入特性各自包括至少一个输入规格极限。在一些实施方案中,这一个或多个输入特性不包括输入规格极限。在一些实施方案中,在所述参数化资源输入集合中没有资源输入与输入特性相关联。
每个节点还与对应过程中的相应阶段的参数化资源输出集合相关联。在一些实施方案中,所述参数化资源输出集合中的至少一个参数化资源输出与一个或多个输出特性相关联。在一些实施方案中,所述一个或多个输出特性各自包括至少一个对应的输出规格极限。在一些实施方案中,这一个或多个输出特性不包括输出规格极限。
多个边缘中的每个边缘指定多个节点中的节点的参数化资源输出集合包括在所述多个节点中的至少一个其他节点的参数化资源输入集合中。
运行数据存储包括多个过程运行。每个过程运行包括所述一个或多个过程中的过程的多个版本中的版本的标识。每个过程运行还包括相应版本的超图中的第一节点的相应参数化资源输入集合的值和所述参数化资源输入的相关联输入特性。每个过程运行还包括第一节点的相应参数化资源输出集合。每个过程运行还包括第一节点的相应参数化资源输出集合中的参数化资源输出的至少一个输出特性的获得值。
统计模块响应于接收标识存在于运行数据存储中的一个或多个过程运行中的一个或多个第一参数化资源输入和/或参数化资源输出的查询,格式化所述一个或多个第一参数化资源输入和/或参数化资源输出以用于分析。在一些实施方案中,查询进一步标识存在于运行数据存储中的一个或多个运行中一个或多个第二参数化资源输入和/或参数化资源输出,使一个或多个第一参数化资源输入和/或参数化资源输出与所述一个或多个第二参数化资源输入和/或参数化资源输出相关,并且格式化所述相关性的数值度量以用于呈现。
在一些替代实施方案中,查询进一步标识存在于运行数据存储中的一个或多个运行中的一个或多个第二参数化输入和/或参数化输出,并且统计模块使用多变量分析技术(例如,特征选择技术,诸如最小角度回归或逐步回归)从存在于运行数据存储中的所有参数化输入和/或参数化输出中进一步标识(i)一个或多个第一参数化输入和/或参数化输出与(ii)存在于运行数据存储中的一个或多个过程运行中的一个或多个第二参数化输入和/或参数化输出之间的相关性。在一些这样的实施方案中,所述一个或多个过程实际上是多个过程,并且根据所述多个过程的子集中的过程运行来标识相关性。在其他实施方案中,所述一个或多个过程是多个过程,并且根据所述多个过程中的单个过程中的过程运行来标识相关性。
在一些实施方案中,将一个或多个第一参数化资源输入和/或参数化资源输出从第一装置导出到第二装置以用于分析。例如,在一些实施方案中,数据被导出为一个或多个制表符分隔文件、CSV文件、EXCEL电子表格、GOOGLE表格,或以适合于SQL数据库的形式输出。
在一些实施方案中,所公开的系统和方法还包括过程评估模块,当针对所述多个过程运行中的节点的运行,参数化资源输出集合中的参数化资源输出的输出特性的获得值超出预定义的输出规格极限时,所述过程评估模块以计算机数据传输的形式生成警报。
在一些实施方案中,用于所述一个或多个过程中的过程的相应多个版本中的第一版本和第二版本在以下方面彼此不同:节点数量、节点的过程阶段标签、参数化资源输入集合中的参数化资源输入、这种参数化资源输入的特性、这种输入特性的规格极限、参数化资源输出集合中的参数化资源输出、这种参数化资源输出的特性和/或这种输出特性的规格极限。
在一些实施方案中,统计模块基于预测,进一步提供所述一个或多个过程中的第一过程的附加过程运行(其不存在于运行数据存储中)的一个或多个第二参数化输入的建议值,所述预测为所述一个或多个第二参数化输入的建议值将改变一个或多个过程运行的数值属性(例如,一个或多个第一参数化输入中的方差的减少)。在一些这样的实施方案中,查询进一步标识存在于运行数据存储中的一个或多个运行中的一个或多个第三参数化输入和/或参数化输出,并且数值属性是一个或多个第一参数化输入和/或参数化输出与一个或多个第三参数化输入和/或参数化输出之间的相关性的置信度。
在一些实施方案中,所述一个或多个过程是多个过程,并且查询进一步标识其过程运行将由统计模块格式化的多个过程的子集。在其他实施方案中,所述一个或多个过程是多个过程,并且查询进一步标识其过程运行将由统计模块格式化的多个过程中的单个过程。
在一些实施方案中,查询进一步标识所述一个或多个过程中的过程运行的子集。
在一些实施方案中,统计模块进一步标识(i)包括运行数据存储中的一个或多个过程运行的第一集合与(ii)包括运行数据存储中的一个或多个过程运行的第二集合之间的相关性,其中在第二集合中的过程运行不在第一集合中。在一些实施方案中,跨越存在于第一集合和第二集合中的多个参数化输入和/或参数化输出来计算相关性。
在一些实施方案中,相应多个过程版本中的过程版本的超图的多个节点中的第一节点的参数化资源输入集合包括第一参数化资源输入。在一些这样的实施方案中,第一参数化资源输入指定用于第一节点的第一资源并且与第一输入特性相关联。在一些这样的实施方案中,第一输入特性是第一资源的粘度值、纯度值、成分值、温度值、重量值、质量值、体积值或批次标识符。在一些这样的实施方案中,第一资源是单一资源或复合资源。在一些实施方案中,第一参数化资源输入指定与第一节点所关联的过程的对应阶段相关联的过程条件(例如,温度、暴露时间、混合时间、设备类型或批次标识符)。
在一些实施方案中,针对所述一个或多个过程中的相应过程执行数据驱动程序。数据驱动程序包括:用于接收针对相应过程的数据集的指令;用于解析所述数据集以便从而获得(i)运行数据存储中的过程运行的标识以及(ii)与过程运行的相应过程的超图中的第一节点的相应参数化资源输出集合相关联的输出特性值的指令;以及用于利用所解析的值填充运行数据存储中的第一节点的参数化资源输出的输出特性值的指令。
在一些实施方案中,对应的输出规格极限包括用于对应参数化资源输出的上限和下限。在一些实施方案中,对应的输出规格极限包括可允许类型的枚举列表。
在一些实施方案中,所述一个或多个过程是多个过程,并且所述多个过程中的第一过程导致第一产品,并且所述多个过程中的第二过程导致第二产品,并且第一产品不同于第二产品。
在一些实施方案中,运行数据存储还包括系谱图,所述系谱图示出(i)一个过程在多个过程运行中的多个版本中的单个过程的版本之间的关系,或(ii)两个或更多个过程在多个过程运行中的相应多个版本中的两个或更多个过程的版本之间的关系。在一些实施方案中,这个系谱图强调(i)一个过程在多个过程运行中的多个版本中的单个过程的版本之间的相似性,或(ii)两个或更多个过程在多个过程运行中的相应多个版本中的两个或更多个过程的版本之间的相似性。在一些实施方案中,这个系谱图强调(i)一个过程在多个过程运行中的多个版本中的单个过程的版本之间的差异,或(ii)两个或更多个过程在多个过程运行中的相应多个版本中的两个或更多个过程的版本之间的差异。
本公开的另一个方面是一种计算机系统,其包括一个或多个处理器、存储器、显示器以及存储在所述存储器中以便由所述一个或多个处理器执行的一个或多个程序。所述一个或多个程序包括用于针对显示器格式化过程的超图的指令。所述过程包括多个阶段并且导致产品或分析信息。超图包括通过多个边缘中的边缘连接的多个节点。多个节点中的每个相应节点包括表示过程中的相应阶段的过程阶段标签,并且与以下两者相关联:(i)到过程中的相应阶段的参数化资源输入集合,其中所述参数化资源输入集合中的至少一个参数化资源输入与一个或多个输入特性相关联,所述一个或多个输入特性包括输入规格极限;以及(ii)到过程中的相应阶段的参数化资源输出集合,其中所述参数化资源输出集合中的至少一个参数化资源输出与一个或多个输出特性相关联,所述一个或多个输出特性包括对应的输出规格极限。多个边缘中的每个相应边缘指定多个节点中的节点的参数化资源输出集合包括在所述多个节点中的至少一个其他节点的参数化资源输入集合中。因此,本公开的图涵盖其中边缘将特定输出连接到特定输入的图。
所述一个或多个程序还包括以下指令:所述指令用于在显示器上将多个节点中的每个相应节点显示为对应的可移动图标,从而显示多个图标,所述可移动图标包括(i)对应的过程阶段标签、(ii)表示与相应的所述节点相关联的参数化资源输出集合的至少一个输出端口、以及(iii)表示与所述节点相关联的参数化资源输入集合的至少一个输入端口。
所述一个或多个程序还包括以下指令:所述指令用于将多个边缘中的每个相应边缘显示为至少所述多个节点中的第一节点的输出端口与第二节点的输入端口之间的线,从而指定第一节点的参数化资源输出集合包括在第二节点的参数化资源输入集合中。通过显示器上的示能表示(affordance)接收来自第一用户的将新过程阶段标签添加到过程的指示。响应于这个指示,将新节点添加到多个节点,并且在显示器上显示对应于新节点的新图标。从第一用户接收(i)新节点的过程阶段标签,(ii)到新节点的参数化资源输入或输出集合的指示,以及(iii)多个节点中不同于新节点的第一节点的参数化资源输入或输出集合的指示。第一用户通过联合选择(a)对应于第一节点的输入端口或输出端口和(b)新图标,指示到新节点的参数化资源输入或输出集合以及第一节点的参数化资源输入或输出集合的指示中的至少一个。所述一个或多个程序还包括以下指令:所述指令用于基于所述联合选择将新边缘添加到所述多个边缘,并且在不同于新图标的图标的所选择输入端口或输出端口与新图标的输入端口或输出端口之间显示新边缘。
在一些实施方案中,多个阶段中的相应阶段的第一过程阶段标签包括到描述相应阶段的视频、说明手册、图像或指令集的链接。在一些实施方案中,第一用户通过将到视频的链接拖动到包括第一过程阶段标签的图标上,将到视频的链接添加到第一过程阶段标签。在一些实施方案中,所述一个或多个程序还包括用于在没有人为干预的情况下将新节点布置在显示器上随至少所述新边缘而变化的位置处的指令。在一些实施方案中,多个用户中的每个用户当前具有相对于超图的编辑和查看权限,并且所述多个用户包括第一用户。
在一些实施方案中,超图的多个节点中的节点的参数化资源输入集合包括第一参数化资源输入和第二参数化资源输入。第一参数化资源输入指定第一资源并且与第一输入特性相关联。第二参数化资源输入指定第二资源并且与第二输入特性相关联,并且第一输入特性不同于第二输入特性。在一些实施方案中,第一输入特性是第一资源的粘度值、纯度值、成分值、温度值、重量值、质量值、体积值或批次标识符。在一些实施方案中,第一资源是单一资源或复合资源。在一些实施方案中,超图的多个节点中的节点的参数化资源输入集合包括第一参数化资源输入,所述第一参数化资源输入指定与第一节点所关联的过程的对应阶段相关联的过程条件。在一些实施方案中,过程条件包括温度、暴露时间、混合时间、设备类型或批次标识符。
在一些实施方案中,对应的输出规格极限包括用于对应参数化资源输出的上限和下限。在一些实施方案中,对应的输出规格极限包括可允许类型的枚举列表。
附图简述
图1示出根据本公开的系统拓扑结构,其包括装置(即计算机系统200)和过程的多个阶段20。
图2示出根据本公开的实施方案的计算机系统。
图3示出根据本公开的实施方案的过程版本。
图4示出根据本公开的实施方案的运行数据存储。
图5示出根据本公开的实施方案的过程评估模块。
图6A、图6B、图6C、图6D和图6E共同示出根据本公开的实施方案的提供对一个或多个过程的过程设计和分析的流程图。
图7示出根据本公开的实施方案的包括通过边缘连接的多个节点的超图,其中突出显示了发酵罐设置阶段。
图8示出根据本公开的实施方案的图7的超图,其中突出显示了培育接种体阶段。
图9示出根据本公开的实施方案的图7的超图,其中突出显示了接种发酵罐阶段。
图10示出根据本公开的实施方案的图7的超图,其中突出显示了补料分批发酵阶段。
图11示出根据本公开的实施方案的图7的超图,其中新的阶段被添加到图7的超图。
图12示出根据本公开的实施方案的图11的超图,其中DW测定阶段和废气测定阶段被添加到图7的超图。
图13示出根据本公开的实施方案的图12的超图,其中一组新阶段被添加到图7的超图。
图14示出根据本公开的实施方案的图13的超图,其中定义了所述一组新阶段。
图15示出根据本公开的实施方案如何定义在图13和图14的超图中定义的一组新阶段。
图16示出根据本公开的实施方案如何定义在图13和图14的超图中定义的一组新阶段中的新标准准备阶段。
图17示出根据本公开的实施方案如何定义在图13和图14的超图中定义的一组新阶段中的新仪器校准阶段。
图18进一步示出根据本公开的实施方案如何定义在图13和图14的超图中定义的一组新阶段中的新仪器校准阶段。
图19示出根据本公开的实施方案如何定义在图13和图14的超图中定义的一组新阶段中的新运行样本阶段。
图20示出根据本公开的实施方案使用在图13和图14的超图中定义的一组新阶段来设置过程运行。
图21进一步示出根据本公开的实施方案使用在图13和图14的超图中定义的一组新阶段来设置过程运行。
图22进一步示出根据本公开的实施方案使用在图13和图14的超图中定义的一组新阶段来设置过程运行。
图23进一步示出根据本公开的实施方案的在图13和图14的超图中定义的一组新阶段中的新运行样本阶段的三个不同过程运行的原始数据。
图24进一步示出根据本公开的实施方案用于分析图23所示数据的选择。
图25示出根据本公开的实施方案的对图23所示数据的分析。
图26示出根据本公开的实施方案的对图23所示数据的进一步分析。
贯穿附图的若干视图,相同的参考数字指代对应的部分。
详述
现在将详细参考实施方案,其实例在附图中示出。在以下详细描述中,阐述了许多具体细节以提供对本公开的充分理解。然而,本领域的普通技术人员将明白,可以在脱离这些具体细节的情况下实践本公开。在其他情况下,众所周知的方法、规程、组件、电路以及网络并未进行详细描述,以便不会不必要地混淆实施方案的方面。
还应了解,虽然在本文中可能使用术语第一、第二等来描述各种元件,但是这些元件不应受这些术语限制。这些术语仅用来将一个元件与另一个元件进行区分。例如,在不背离本公开的范围的情况下,第一主题可称为第二主题,并且类似地,第二主题可称为第一主题。第一主题和第二主题均为主题,但是它们不是相同的主题。
本公开中使用的术语仅用于描述具体实施方案的目的,而不意图限制本发明。除非上下文另外明确指示,否则如本发明的说明书和所附权利要求中使用的单数形式“一个(种)”和“所述”还意图包括复数形式。还将理解,如本文使用的术语“和/或”指代并且涵盖一个或多个相关联列出项目的任何和所有可能组合。将进一步理解,术语“包括(comprises)”和/或“包括(comprising)”在用于本说明书中时,规定存在所陈述的特征、整数、步骤、操作、元件和/或组件,但是不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或其群组。
如本文所使用,术语“如果”可解释为表示“在……时”或“在……后”或“响应于确定”或“响应于检测到”,这取决于上下文。类似地,短语“如果确定”或“如果检测到[所陈述的条件或事件]”可解释为表示“在确定后”或“响应于确定”或“在检测到[所陈述的条件或事件]后”或“响应于检测到[所陈述的条件或事件]”,这取决于上下文。
结合图1至图5描述提供根据本公开的用于提供对一个或多个过程的过程设计和分析的系统48的详细描述。具体地,图1示出具有多个阶段20的过程或流水线。图1中的每个相应阶段20由示例性反应室示出,以指示发生了一种形式的材料变换。然而,不要求这种材料变换在反应室中发生。如图1进一步示意性地示出,每个阶段20包括参数化输入集合308和参数化输出集合314。在一些实施方案中,如图1所示,这些输入308和输出314的描述可能通过通信网络106提供给计算机系统200。例如,在阶段20-2,当过程运行完成这个阶段时,包括这个阶段的参数化输出的文件被存储在与这个阶段相关联的目录中。然后,扫描或监测过程获取这个新文件并将其发送到计算机系统200,在所述计算机系统200中将其上传到存储在计算机系统200中的对应过程运行中。更详细地,在一些实施方案中,输入308或输出314由测量装置电子地测量。例如,在一些实施方案中,在附接到阶段20的仪器或其他组件的任何计算机上作为后台进程(如Google Drive或Dropbox Sync)运行的软件组件(诸如同步引擎)监测同步的文件夹。当新的仪器数据文件被添加到文件夹时,软件解析与所述阶段相关联的数据并且通过通信网络106将所述数据发送到计算机系统200。在一些实施方案中,使用硬件解决方案来传达过程的阶段20的输入集合308和输出集合314。在这种方法中,通过与阶段20的仪器或其他组件的直接接口来执行数据采集和转移。例如,在一些实施方案中,使用BeagleBone黑色微控制器(http://beagleboard.org/BLACK)通过网络106将此类数据传输到计算机系统200。在一些实施方案中,使用经由HTTP POST的HTTPS端口443或表述性状态转移来将数据(例如,用于与过程的阶段20相关联的参数化资源输入集合310的值和/或用于参数化资源输出集合314的值)从相应阶段20传达给计算机系统。
当然,系统48的其他拓扑结构是可能的,例如,计算机系统200实际上可以构成在网络中链接在一起的若干计算机或者可以是云计算环境中的虚拟机。因此,图1所示的示例性拓扑结构仅用于以本领域技术人员容易理解的方式描述本公开的实施方案的特征。
参考图2,在典型的实施方案中,用于提供对一个或多个过程的过程设计和分析的计算机系统200包括一个或多个计算机。为了在图2中示出的目的,计算机系统200被表示为包括计算机系统200的所有功能的单个计算机。然而,本公开不限于此。计算机系统200的功能可以分布在任何数量的联网计算机上,和/或驻留在若干联网计算机中的每一个上,和/或通过托管在通过通信网络106可访问的远程位置处的一个或多个虚拟机上而分布。本领域的技术人员将理解,对于计算机系统200来说,许多不同的计算机拓扑结构是可能的,并且所有此类拓扑结构都在本公开的范围内。
计算机系统200被独特地构造来:通过最小的努力以可计算的方式记录和存储数据,定量地搜索所有实验设计和数据或其任何子集,应用实时统计分析,通过设计实现质量,更新实验过程和数据收集系统,通过自动的关键质量分析标识有意义的变量,定期获得真实且明确的结果,访问透明数据和结果,开放并访问结果(并且安全地控制对任何人或任何团队的访问),定量地且直接地以他人的设计和结果为基础,并且将支持结论的证据明确地传达给团队成员或合作伙伴。
转到图2并且牢记前述内容,计算机系统200包括一个或多个处理单元(CPU)274、网络或其他通信接口284、存储器192(例如,随机存取存储器)、一个或多个磁盘存储装置和/或任选地由一个或多个控制器288访问的持久性装置290、用于互连上述组件的一个或多个通信总线112以及用于为上述组件供电的电源276。存储器192中的数据可以使用已知的计算技术(诸如高速缓存)与非易失性存储器290无缝地共享。存储器192和/或存储器290可包括相对于中央处理单元274远程定位的大容量存储装置。换句话说,存储在存储器192和/或存储器290中的一些数据实际上可以托管在计算机上,所述计算机在计算机系统200的外部,但是可以由所述计算机系统使用网络接口284通过互联网、内联网或其他形式的网络或电子电缆(在图2中示为元件106)电子地访问。
计算机系统200的存储器192存储:
·操作系统202,其包括用于处置各种基本系统服务的规程;
·超图数据存储204存储,对于所述一个或多个过程中的每个相应过程206,所述超图数据存储204包括相应过程206的相应多个版本208;
·运行数据存储206,其存储多个过程运行,每个过程运行包括所述一个或多个过程中的过程的多个版本中的版本208的标识;
·统计模块212,其用于分析过程数据;
·过程评估模块216,其用于在过程中出现特定条件时发起警报;以及
·一个或多个任选的数据驱动器218,每个数据驱动器用于所述一个或多个过程中的相应过程,所述数据驱动器包括用于接收相应过程的数据集的指令和用于处理所述数据集的指令。
在一些实现方式中,以上标识的计算机系统200的数据元素或模块中的一个或多个存储在一个或多个前述存储器装置中,并且对应于用于执行上述功能的指令集。以上标识的数据、模块或程序(例如,指令集)不需要实现为单独的软件程序、规程或模块,并且因此这些模块的各种子集可以在各种实现方式中组合或以其他方式重新布置。在一些实现方式中,存储器192和/或290任选地存储以上标识的模块和数据结构的子集。此外,在一些实施方案中,存储器192和/或206存储以上未描述的附加模块和数据结构。
转到图3,描述了过程版本208的实施方案的更多细节。所述过程版本包括超图302。超图302包括多个节点,是以方向、因果关系和顺序为基础的。例如,多个节点中的每个相应节点304通过边缘连接到多个节点中的至少一个其他节点。多个节点中的每个相应节点304包括表示对应过程中的相应阶段的过程阶段标签306。在一些实施方案中,节点304是可用于构建更大过程的变换事件的完整且独立的描述。节点304足够通用以服务于许多过程,诸如化学过程、生命科学过程和食物制备过程。有利地,节点304在被复制到其他过程中时不失去其意义或效用。因此,在优选的实施方案中,节点304的定义不依赖于超图302中的其他节点的定义。如图3所示,节点304被构造来以独特的方式包含数据,以便促进后续数据挖掘和推理引擎基于过程版本208来分析过程运行。
多个节点中的每个相应节点304与到对应过程中的相应阶段的参数化资源输入集合308相关联。参数化资源输入集合308中的至少一个参数化资源输入310与一个或多个输入特性312相关联,所述一个或多个输入特性包括输入规格极限314。输入特性312的实例是诸如人、设备、材料和数据的事物的属性(例如,测量值、数量等)。对于单个参数化资源输入(例如,温度、流速、粘度、pH值、纯度等),可存在多个输入特性。在一些实施方案中,对于特定的参数化资源输入,存在单个输入特性。
多个节点中的每个相应节点304还与到对应过程中的相应阶段的参数化资源输出集合314相关联。参数化资源输出集合314中的至少一个参数化资源输出316与一个或多个输出特性318相关联,所述一个或多个输出特性包括对应的输出规格极限320。输出特性318的实例包括诸如人、设备、材料和数据的事物的属性(例如,测量值、数量等)。对于单个参数化资源输出,可存在多个输出特性。在一些实施方案中,对于特定的参数化资源输出,存在单个输出特性。
图17和图18示出了以上概念。图17示出超图302的一部分并且示出所述超图的所述部分中的节点304。节点“仪器校准”304-14被突出显示。因此,在图17的右侧示出这个节点的参数化资源输入集合308和参数化资源输出集合314。节点“仪器校准”的参数化资源输入集合308包括硫酸310-1、柱310-2、柠檬酸310-3、葡萄糖310-4、甘油310-5和HPLC 310-6。因此,示例性的参数化资源输入集合308示出了多种可能类型的参数化输入中的两种是(i)组合物(例如,硫酸、柠檬酸、葡萄糖、甘油等)和(ii)设备类型(例如,柱、HLLC等)。用于节点“仪器校准”的参数化资源输出集合314由HPLC 316组成。
转到图18,提供了关于参数化资源输入310-2“柱”和参数化资源输入310-3“柠檬酸”的更多细节。参数化资源输入310-3“柠檬酸”与包括输入规格极限314的一个或多个输入特性312相关联。例如,参数化资源输入310-3“柠檬酸”的一个输入特性是“pH值”312-3-1,并且这个特性包括输入规格极限314-3-1。实际上,输入规格极限314-3-1表示为下限(pH值3.5)、目标极限(pH值4)和上限(pH值4.5)。参数化资源输入310-3“柠檬酸”的另一输入特性是“浓度”312-3-2,并且这个特性包括输入规格极限314-3-2。输入规格极限314-3-2表示为下限(9.75g/L单位)、目标极限(10g/L单位)和上限(10.25g/L单位)。
回到图3,每个超图302包括多个边缘。多个边缘中的每个相应边缘322指定多个节点中的源节点304的参数化资源输出集合314包括在所述多个节点中的至少一个其他目的地节点304的参数化资源输入集合308中。换句话说,边缘指定在给定过程中输入到一个节点(目的地节点)中的材料、设备、人或其他事物的状态与已经从那个过程的超图中的另一个节点(源节点)输出的材料、设备、人或其他事物的状态相同。在一些实施方案中,边缘指定输入到多个节点(目的地节点)中的材料、设备、人或其他事物的状态在给定过程中与已经从那个过程的超图中的另一个节点(源节点)输出的材料、设备、人或其他事物的状态相同。此外,目的地节点可以连接到两个或更多个源节点,这意味着到目的地节点的输入包括处于与其在给定过程的两个或更多个源节点的输出中的状态相同的状态下的材料、设备、人或其他事物。
过程版本控制208是所公开的系统和方法的有利特征。例如,当通过跨过程的各种过程运行的相关分析将特定节点的输入或输出标识为整个过程的可再现性较差的原因时,可以在连续的过程版本中添加有问题节点之前和之后的附加节点,并且然后可以执行这些新过程版本的过程运行。此外,有利地,在一些实施方案中,来自较旧的过程版本和较新的过程版本的数据可以在跨所述过程版本的所有过程运行的相关性分析中一起使用,以确定与有问题节点相关联的可变性或其他不利属性的根本原因,并且由此开发充分解决所述问题的过程版本。实际上,可以分析来自产生类似但不相同的产品或产生类似但不相同的分析信息的多个过程的过程运行,以标识此类问题。
如图3所示,每个节点304具有输入(参数化资源输入集合308),并且这些参数化资源输入310中的每一个具有一个或多个输入特性312,并且这些输入特性中的每一个具有输入规格极限314。此外,每个节点304具有一个或多个参数化资源输出(参数化资源输出集合314),并且这些参数化资源输出316中的每一个具有一个或多个输出特性318。此外,这些输出特性中的每一个具有输出规格极限320。参数化资源输出集合用作到其他节点的输入,并且此类关系由边缘表示。此外,特定节点的参数化资源输出集合314可以用作到多于一个节点的输入,因此边缘和节点构成超图。通过以这种方式定义过程,可以容易地创建过程版本208,集成来自不同来源和装置的数据采集,并且查询过程运行以标识相关性,减少实验方差,并改进过程可再现性。过程运行调用过程版本并且导致所述过程版本中的超图中的节点的输入集合和输出集合的值(例如,测量值)。
在一些情况下,目的地节点304仅包括来自一个源节点324的单个边缘322。在此类情况下,源节点324的参数化资源输出集合314构成目的地节点326的整个参数化资源输入集合308。这在图17中示出,其中在节点304-14与304-15之间存在单个边缘322-14。因此,节点304-14的参数化资源输出集合314构成节点304-15的整个参数化资源输入集合308。
为了说明过程中节点的概念,考虑设计用于测量发酵罐培养液温度的节点。到这个节点的参数化输入集合308包括对发酵罐培养液和进行温度测量的热电偶的描述。热电偶将包括输入特性,所述输入特性包括其清洁度状态、校准状态和热电偶的其他特性。到这个节点304的参数化输出集合314包括发酵罐培养液的温度和针对这个温度的输出规格极限(例如,所述温度的可接受范围)。节点304的另一个可能的参数化资源输出316是热电偶本身以及在已经获取温度之后的热电偶的特性316,诸如其清洁度状态和校准状态。对于这些特性316中的每一个,同样存在对应的输出规格极限。
在一些情况下,目的地节点304包括多个边缘322,每个这种边缘来自不同的源节点324。在此类情况下,每个这种源节点324的参数化资源输出集合314共同构成目的地节点326的参数化资源输入集合308。这在图17中示出,其中在源节点304-13与目的地节点304-14之间存在第一边缘(边缘322-11),并且在源节点304-12与目的地节点304-14之间存在第二边缘(边缘322-12)。因此,节点304-13的参数化资源输出集合314加上节点304-12的参数化资源输出集合314构成节点304-14的参数化资源输入集合308。
转到图4,提供了运行数据存储210的更多细节。运行数据存储210包括多个过程运行。也就是说,当过程的节点开始运行时,获得和/或使用实际材料批或设备件等作为特定过程版本406的真实世界实例。因此,每个过程运行402包括所述一个或多个过程中的过程206的多个版本中的所标识404过程版本208的节点406的标识。对于过程版本208的所标识节点406,过程运行402还包括相应过程版本208的超图302中的第一节点304的相应参数化资源输入集合308的值以及所述参数化资源输入的相关联输入特性312。对于所标识的过程版本208,过程运行402还包括第一节点304的相应参数化资源输出集合314。此外,对于所标识的过程版本208,过程运行402还包括相应过程版本的超图302中的第一节点304的相应参数化资源输出集合314中的参数化资源输出316的至少一个输出特性318的获得值。图19至图24示出针对特定过程版本的三个过程运行402,其中每个过程运行402的特征在于不同的条件(例如,到过程版本的超图中的一个或多个节点的一个或多个参数化输入的一个或多个输入特性的不同量)。
在一些实施方案中,运行数据存储210包括具有一个或多个过程集合422的系谱图420。每个过程集合422包括相关过程版本424的标识424。例如,在一些实施方案中,过程集合420中的第一过程版本404和过程集合420中的第二过程版本404具有相同的超图,但是针对超图中的一个节点的输出特性、输出规格极限、输入特性或输入规格极限是不同的。在另一个实例中,过程集合420中的第一过程版本404和过程集合420中的第二过程版本404具有除一个节点之外、除两个节点之外、除三个节点之外或除四个节点之外的所有节点具有共同之处的超图。通常,过程集合中的过程版本在过程随着时间被精化的意义上彼此相关,并且所述过程的各种版本被保存为过程版本。过程的精化包括以下各项的任何组合:从超图中添加或移除节点;从超图中添加或移除边缘;添加或移除到超图中的一个或多个节点的参数化资源输入;添加或移除到超图中的一个或多个节点的参数化资源输出;添加、移除或改变超图中的一个或多个节点的参数化资源输入的输入特性或输入规格极限;和/或添加、移除或改变超图中的一个或多个节点的参数化资源输出的输出特性或输出规格极限。
转到图5,提供了过程评估模块216的更多细节。过程评估模块216利用所公开的过程的独特体系结构。具体地,当评估特定节点304的参数化资源输出316是否满足特定的相关联输出规格极限320时,仅需要评估那个节点的对应参数化资源输出的过程运行中的值。其他节点的输入和输出不需要为此目的进行评估。因此,当针对过程版本的超图中的节点的运行,参数化资源输出集合中的参数化资源输出的输出特性的获得值超出输出规格极限时,可能以计算机数据传输的形式生成警报。此外,这个警报可移植到使用相同节点的其他过程版本。因此,在一些实施方案中,过程评估模块由过程版本502组织。对于每个过程版本,标识需要过程警报的节点504。对于每个这种节点504,标识到节点的一个或多个参数化资源输出506。对于一个或多个参数化资源输出中的每一个,标识针对所述参数化资源输出的一个或多个警报值508。如果触发了针对特定过程版本的特定节点的参数化资源输出的特性的警报值,则传达对应于警报的计算机数据传输510。在一些实施方案中,计算机数据传输510是发送到用户接口或客户端计算机的指示已经触发警报的消息。在一些实施方案中,计算机数据传输呈文本消息、电子邮件、SMS消息或可听警报的形式。为了说明,考虑其中节点304的参数化资源输出316的输出特性318的输出规格极限320指定输出pH值不应超过7的情况。因此,设置针对这个输出特性的警报508。如果在过程运行502中,资源输出的pH值实际上超过7.0,则传达对应于这个警报的计算机数据传输510。
系统48通过在实现过程的性能目标(例如,令人满意地稳定过程)所需的任何级别的分辨率下的状态(例如,节点输入和节点输出的状态)的明确定义提供了用于过程的独特设计。此类状态包括例如每个节点输入和输出的“类型”和“数量”。仅举几个例子,“类型”的实例可以是一件设备、人力资源、一类材料或物质组成。系统48有利地提供将多个不同的功能区(例如,化学系统、生物学系统、发酵系统、分析系统、不同的控制系统等)结合成可重复材料变换(节点)的无缝过程的方式,所述无缝过程可以被版本化,并且可使用统计技术来评估来自所述无缝过程的过程运行的数据以实现产品控制(例如,标识不希望的可变性的根本原因)。
有利地,所公开的数据结构完全定义了节点(它们的输入、它们的输出以及因此在每个节点处发生的变换),而在每个节点输入和每个节点输出的相关特性方面没有任何歧义。然而,应指出的是,在节点内发生的实际变换不一定需要被定义为超出用于记录保持和标识目的的基本描述(阶段标签)。在一些情况下,过程运行(其中到过程中的节点的输入发生改变)开始运行,并且鉴于这些改变的输入来对过程的输出或最终产品进行统计分析,以确定输入中的变化是否改进了过程的最终产品的方面(例如,再现性、产量等)。所公开的系统和方法的一个益处是它们提供了真正理解过程的动态(例如,某些节点输入的变化或节点输入的特性如何影响最终产品)的机制,并且因此允许更容易地成功扩大所述过程的规模。由于在所公开的系统和方法中定义过程的方式,可能找到在所定义过程中导致不期望的结果(例如,不良的产率、差的再现性等)或就此而言,期望的结果的误差来源。过程中的不希望的误差的实例是应用相关的,并且取决于例如节点输入或输出的类型,但是可以是例如测量误差或未能量化或甚至标识节点输入或节点输出的相关特性。例如,如果节点输入是糖,则可能出现测量误差,因为测量输入到节点的糖的重量的过程不够精确。在另一个实例中,如果节点输入是糖,则糖的相关特性可以是批号,因为在特定过程中,糖批号碰巧对总产品产量具有深刻影响。
既然已经公开了用于提供对一个或多个过程的过程设计和分析的系统48的细节,参照图6公开根据本公开的实施方案的关于网络的过程和特征的流程图的细节。
如图6A的框602中所示,维持超图数据存储204。对于一个或多个过程中的每个相应过程206,超图数据存储204包括相应过程的相应多个版本。每个相应版本208包括超图302,所述超图302包括通过多个边缘中的边缘322连接的多个节点304。所述多个节点中的每个相应节点304包括表示对应过程中的相应阶段的过程阶段标签。
图7示出过程版本208。所述过程版本包括超图,所述超图包括对应于过程的相应阶段的多个节点304(例如,“发酵罐准备”、“发酵罐设置”、“培养基准备”、“培育接种体”、“接种发酵罐”、“补料分批发酵”和“度量T、Ph、D、DO”)。在一些实施方案中,支持并发性。也就是说,多个用户(每个用户在与计算机系统200通信的不同客户端计算机上操作)可以查看图7中显示的过程版本的实例,对所述过程版本进行改变,并且查看和分析来自利用所述过程版本的过程运行的数据。
每个节点304与到对应过程中的相应阶段的参数化资源输入集合308相关联。参数化资源输入集合308中的至少一个参数化资源输入310与一个或多个输入特性312相关联。所述一个或多个输入特性包括输入规格极限314。每个节点304还与到对应过程中的相应阶段的参数化资源输出集合314相关联。所述参数化资源输出集合中的至少一个参数化资源输出316与一个或多个输出特性相关联。所述一个或多个输出特性包括对应的输出规格极限。图7示出节点304-4“发酵器设置”的参数化资源输入集合308和参数化资源输出集合314。图8示出节点304-3“培育接种体”的参数化资源输入集合308和参数化资源输出集合314。图9示出节点304-5“接种发酵罐”的参数化资源输入集合308和参数化资源输出集合314。图10示出节点304-6“补料分批发酵”的参数化资源输入集合308和参数化资源输出集合314。在一些实施方案中,用户可以简单地点击节点304以观察它们的输入和输出。此外,可以将视频、图片或评论形式的非结构化数据添加到节点304。例如,通过简单地将到视频的图标链接拖动到节点304的表示上,可以将示出执行与节点相关联的规程的正确方式的视频链接到节点。例如,可以将关于执行发酵罐设置的适当方式的视频拖动到图7的“发酵罐设置”节点304-4上。此后,当用户点击节点304-4时,播放视频。
多个边缘中的每个相应边缘322指定多个节点中的节点的参数化资源输出集合包括在所述多个节点中的至少一个其他节点的参数化资源输入集合中。因此,转到图7来说明,节点304-6“补料分批发酵”的参数化资源输入集合由节点304-5“接种发酵罐”和304-2“培养基准备”的参数化资源输出集合组成。
图11和图12示出将新节点304-8“DW测定”和304-9“废气测定”添加到现有超图,并且图13和图14示出将称为“HPLC测定”的一组节点添加到所述超图。HPLC测定组是图7的现有超图的扩展,并且包括这种扩展的节点和边缘。参考图15和图16,HPLC测定开始于三个初始节点,即节点304-10“溶剂准备”、节点304-11“柱准备”和节点304-12“标准准备”。在一些实施方案中,节点的名称由用户从所允许的节点名称的数据库中选择,以便确保节点名称的一致性。在一些实施方案中,节点输入310和输出316的名称也由用户从所允许的节点输入和输出名称的数据库中选择,以便确保节点输入和输出名称的一致性。在一些实施方案中,节点输入特性312和节点输出特性318的名称也由用户从所允许的节点输入特性名称和节点输出特性名称的数据库中选择,以便确保它们的一致性。图17示出超图302的一部分,所述部分在超图的这个部分中定义了更多节点之后由“HPLC测定”涵盖。在图17中选择节点“仪器校准”304-14。因此,在图17的右侧示出节点304-14的参数化资源输入集合308和参数化资源输出集合314。
如以上所讨论,过程206的版本208彼此相关。在一些实施方案中,过程604的每个版本208产生相同的产品。然而,通常,过程的相应多个版本中的第一版本和第二版本在某些方面彼此不同,诸如(仅列举一些可能性)在以下方面:节点的数量、节点的过程阶段标签、参数化资源输入集合中的参数化资源输入、参数化资源输出集合中的参数化资源输出、参数化资源输入规格极限或参数化资源输出规格极限(604)。
为了说明参数化资源输入集合308,在一些实施方案中,相应多个过程版本中的过程版本208的超图302的多个节点中的节点304的参数化资源输入集合308包括第一参数化资源输入310-1和第二参数化资源输入310-2。第一参数化资源输入指定第一资源并且与第一输入特性312-1相关联(606)。第二参数化资源输入310-2指定第二资源并且与第二输入特性312-2相关联。在一些实施方案中,第一输入特性是第一资源的粘度值、纯度值、成分值、温度值、重量值、质量值、体积值或批次标识符(608)。图7示出。节点304-4“发酵罐设置”在其相关联的参数化资源输入集合308中包括发酵罐310-3和废物瓶310-5以及其他资源输入。虽然在图7中未示出,但是发酵罐310-3与第一输入特性,诸如发酵罐的尺寸或发酵罐商标/型号相关联。此外,废物瓶310-5与第二输入特性,诸如废物瓶310-5的尺寸或废物瓶310-5商标和型号相关联。
在一些实施方案中,资源输入310是单一资源。例如,在图7中,资源310-1至310-10全部是单一资源的实例。在一些实施方案中,资源输入310是复合资源。复合资源的实例包括但不限于组合物(例如,培养基、培养液等)和多组件设备的混合物。
参考图6B,在一些实施方案中,相应多个过程版本中的过程版本208的超图302的多个节点中的第一节点304的参数化资源输入集合308包括第一参数化资源输入310,并且这个第一参数化资源输入指定与第一节点304所关联的过程的对应阶段相关联的过程条件(612)。例如,在一些实施方案中,这个过程条件是温度、暴露时间、混合时间、浓度、设备类型或批次标识符(614)。
如以上指出的,对于给定的节点,所述节点的参数化资源输出集合中的至少一个参数化资源输出与一个或多个输出特性相关联,并且所述一个或多个输出特性包括对应的输出规格极限。在一些实施方案中,这个对应的输出规格极限包括用于对应参数化资源输出的上限和下限(616)。为了说明,输出特性的实例是组合物的pH值。在这种实施方案中,输出规格极限指定了所允许的组合物pH值的上限和所允许的组合物pH值的下限。在替代实施方案中,这个对应的输出规格极限包括可允许类型的枚举列表(618)。为了说明,输出特性的实例是材料的晶体取向。在这种实例中,输出规格极限指定了所允许的材料的晶体取向的枚举列表。
在一些实施方案中,超图像数据存储中的一个或多个过程实际上是多个过程。此外,所述多个过程中的第一过程导致第一产品并且所述多个过程中的第二过程导致不同的第二产品(620)。例如,超图数据存储中的第一过程可导致一种类型的组合物的制造,并且超图数据存储中的另一个过程可导致另一种组合物的制造。
参考图6B的框622,还维持运行数据存储210。运行数据存储包括多个过程运行402。在典型的实施方案中,在执行针对过程版本208的过程运行402之前锁定过程版本208,以使得不能对过程版本208进行进一步的改变。如果需要对底层过程206进行改变,则在此类实施方案中定义新的过程版本208。
每个过程运行402包括所述一个或多个过程中的过程206的多个版本中的过程版本404(208)的第一节点的标识,如图4所示。此外,在过程运行中提供相应版本的超图302中的第一节点406的相应参数化资源输入集合408的值以及所述参数化资源输入的相关联输入特性410。更准确地说,在过程运行中提供相应版本的超图302中的节点406的参数化资源输入集合408中的参数化资源输入的特性的值。图20至图22示出基于图19所示的超图来设置针对过程版本的特定节点的三个过程运行402-1、402-2和402-3。在图22中,键入参数化资源输入“柠檬酸”和“柱”的特性的值。具体地,参考图22,将参数化资源输入“柠檬酸”的特性“pH值”设定为5,并且将参数化资源输入“柱”的特性“包装材料”的值设定为“Saphadex HR”。图23示出来自此类过程运行的原始数据。图24示出选择以分析这些过程运行,并且图25示出此类过程运行的结果分析。方便地,如图25和图26所示,可以使用查询2502和切换2504来选择查看哪些过程运行的哪些特性(例如,底层过程版本的节点的输入或输出特性)。此外,参考图26,可以查看基于来自此类过程运行的原始数据所计算的特性(例如,最终产品的量除以输入材料的数量)以及所计算的特性之间的相关性。有利地,由于基于底层过程版本的节点定义过程运行的结构化方式,可能自动设置所执行过程运行的原始数据(例如,图23所示的原始数据)的预定义过程计算(例如,过程产量计算),以使得当执行新的过程运行时,此类过程计算自动地应用于原始数据。这大大减少了分析过程运行的劳动。
每个过程运行402包括相应版本208的超图302中的主题节点304的相应参数化资源输出集合412。过程运行402还包括节点的相应参数化资源输出集合中的参数化资源输出的至少一个输出特性的获得值。
在一些实施方案中,运行数据存储210还包括系谱图420,其示出(i)一个过程在多个过程运行中的多个版本中的单个过程的版本之间的关系,或(ii)两个或更多个过程在多个过程运行中的相应多个版本中的两个或更多个过程的版本之间的关系(624)。例如,在一些实施方案中,过程集合420中的第一过程版本404和过程集合420中的第二过程版本404具有相同的超图,但是针对超图中的一个节点的输出特性、输出规格极限、输入特性或输入规格极限是不同的。在另一个实例中,过程集合420中的第一过程版本404和过程集合420中的第二过程版本404具有除一个节点之外、除两个节点之外、除三个节点之外或除四个节点之外等等的所有节点具有共同之处的超图。所述系谱图提供了辨别给定过程的各种过程版本之间的关系的有利方式。
转到图6C,还维持统计模块212(626)。统计模块212利用运行数据存储210和超图数据存储204的结构以实现过程运行的分析。具体地,统计模块212与运行数据存储210和超图数据存储204的独特结构组合来提供用于支持对过程206的许多不同组件的统计过程控制(SPC)的有利平台,并且因此提供用于分析并稳定此类过程的强有力工具。SPC是使用统计方法的质量控制方法。它用于监测和控制过程。监测和控制过程确保它们以充分发挥潜能的方式操作。例如,以充分发挥潜能的方式,过程206可以在最小化浪费的情况下制造尽可能多的合格产品。SPC可应用于能够测量“合格产品”(满足规格的产品)输出的任何过程204。SPC利用控制图,即关注连续改进和过程运行402(例如,实验)的设计。参见,例如,Barlow和Irony,1992年,“Foundations of statistical quality control”in Ghosh,M.&Pathak,P.K.(编著)Current Issues in Statistical Inference:Essays in Honor of D.Basu,Hayward,California,Institute of Mathematical Statistics,第99-112页,所述文献以引用的方式并入本文。
有利地,响应于接收标识存在于运行数据存储中的一个或多个过程运行中的一个或多个第一参数化资源输入和/或参数化资源输出的查询,统计模块212能够容易地检索和格式化所述一个或多个第一参数化资源输入和/或参数化资源输出以用于分析,而不是必须跟踪与过程相关联的不同形式的不同数据或者跟踪利用所述过程的节点的过程运行,以便支持SPC。在一些实施方案中,例如,数据被格式化为一个或多个制表符分隔文件、CSV文件、EXCEL电子表格、GOOGLE表格,和/或以适合于关系数据库的形式格式化。具体地,数据被构造来确保可以有效地分析此类数据,以使得在随后的分析中不会忽略潜在的相关性。作为SPC的一部分执行的这种分析的实例是相关性分析,诸如图26所示的根本原因分析。根本原因分析描述于例如Wilson等人,1993年,Root Cause Analysis:A Tool for Total Quality Management,Milwaukee,Wisconsin,ASQ Quality Press.,第8-17页,所述文献以引用的方式并入本文。在图26所示的根本原因分析之前,查询标识存在于运行数据存储中的一个或多个过程运行中的一个或多个第一参数化资源输入(例如,氨基酸类型)和/或参数化资源输出(例如,柠檬酸盐浓度)。然后,格式化并输出用于所述一个或多个第一参数化资源输入和/或参数化资源的数据以用于分析。利用此类格式化数据,进行诸如图26的根本原因分析的分析。在一些实施方案中,格式化查询结果以用于第三方统计分析包诸如JMP(英国白金汉郡的SAS,http://www.jmp.com/en_dk/software.html)。使用这种第三方统计分析包的分析通常导致对新过程版本的提议,在所述新过程版本中,添加或移除节点,或者进一步定义或重新定义到现有节点的输入或输出,以便标识和移除不希望的过程可变性(例如,以稳定过程)。
查询可以是可用于运行数据存储210中的一个或多个过程的任何组合的过程版本的任何组合的任何资源输入或输出、或这些输入或输出的任何特性。因此,在一些实施方案中,查询进一步标识存在于运行数据存储中的一个或多个运行中的一个或多个第二参数化资源输入和/或参数化资源输出(或其特性),并且使一个或多个第一参数化资源输入和/或参数化资源输出和所述一个或多个第二参数化资源输入和/或参数化资源输出相关,并且格式化这种相关性的数值度量以用于呈现(628)。在一些实施方案中,相关性的数值度量是在低数字与高数字之间的标度上,其中低数字(例如,零)指示无相关性,并且高数字(例如,一)指示跨所述一个或多个第一参数化资源输入和/或参数化资源输出以及所述一个或多个第二参数化资源输入和/或参数化资源输出的完全相关性。
在一些实施方案中,查询进一步标识存在于运行数据存储中的一个或多个运行中的一个或多个第二参数化输入和/或参数化输出(或其特性),并且统计模块使用多变量分析技术从存在于运行数据存储中的所有参数化输入和/或参数化输出中进一步标识(i)一个或多个第一参数化输入和/或参数化输出之间的相关性与(ii)存在于运行数据存储中的一个或多个过程运行中的一个或多个第二参数化输入和/或参数化输出之间的相关性(630)。
在一些实施方案中,查询标识(i)一个或多个第一参数化输入和/或参数化输出的一个或多个特性,以及(ii)存在于运行数据存储中的一个或多个运行中的一个或多个第二参数化输入和/或参数化输出的一个或多个特性,并且统计模块使用多变量分析技术从存在于运行数据存储中的所有参数化输入和/或参数化输出中进一步寻找(i)所述一个或多个第一参数化输入和/或参数化输出的所标识的特性与(ii)存在于运行数据存储中的一个或多个过程运行中的一个或多个第二参数化输入和/或参数化输出的所标识的一个或多个特性之间的相关性。
在一些实施方案中,以上过程调用包括特征选择技术(例如,最小角度回归、逐步回归)的多变量分析技术(632)。特征选择技术在以下方面是特别有利的:从存在于过程运行集合中的众多变量(例如,节点的输入的输入特性的值和输出的输出特性的值)中标识,哪些变量(例如,哪些节点的输入的哪些输入特性和/或哪些节点的输出的哪些输出特性)对所述过程的产品的特性具有显著的因果效应(例如,哪些变量是可再现性差、产量低的原因,或者相反地,哪些变量是再现性优异、产量较高的原因)。特征选择技术描述于例如Saeys等人,2007年,“A review of feature selection techniques in bioinformatics”,Bioinformatics 23,第2507-2517页以及Tibshirani,1996年,“Regression and Shrinkage and Selection via the Lasso”,J.R.Statist.Soc B,第267-288页,所述文献中的每一个以引用的方式并入本文。
在一些实施方案中,所述一个或多个过程是多个过程,并且根据所述多个过程的子集中的过程运行来标识相关性(634)。在此类实施方案中,不要求标识这种相关性的每个过程制造相同的产品。此类实施方案是非常有利的,因为它们允许调查在不同产品的制造中使用的过程运行中的不期望的过程可变性。例如,在相关性分析中使用的一些过程运行可以制造生物制品A,并且在相同的相关性分析中使用的其他过程运行可以制造生物制品B。使用来自生物制品A和B的过程运行的数据的相关性分析允许调查产品相关的变化原因,例如像,非明确定义的发酵步骤。例如,输入到生物制品A和B两者的过程运行中的这个发酵步骤中的糖可能未被充分定义以确保过程稳定性。可以例如通过跨生物制品A和B两者的过程运行的相关性分析,将这些过程版本共有的变化源的另一个实例标识为由于老化开始出现故障的一件设备。这都是可能的,因为所公开的系统和方法有利地将一致的框架强加给制造不同产品的过程运行。因此,可能聚合来自跨不同产品的过程运行,并且对这些过程运行中的任何期望的输入、输入特性、输出和/或输出特性或其规格极限的集合执行代表性过滤,以便例如发现与此类过程所制造的实际产品无关(或相关)的过程可变性来源。
在一些实施方案中,所述一个或多个过程是多个过程,并且根据所述多个过程中的单个过程中的过程运行来标识相关性(636)。在此类实施方案中,标识这种相关性的每个过程制造相同的产品或产生相同的分析信息。此类实施方案用于例如准确地标识通过所述过程制造产品或产生分析信息的关键可变性来源。
在一些实施方案中,所述一个或多个过程是多个过程,并且查询进一步标识其过程运行将由统计模块格式化的多个过程的子集(638)。
转到图6D,在一些实施方案中,统计模块212基于预测,进一步提供所述一个或多个过程中的第一过程的一个或多个附加过程运行(其不存在于运行数据存储210中)的一个或多个第二参数化输入的建议值,所述预测为所述一个或多个第二参数化输入的建议值将改变此类过程运行的产品的数值属性(640)。在一些实施方案中,所述数值属性是一个或多个第一参数化输入中的方差的减少(642)。例如,利用这种实施方案来标识以下情况:其中由过程运行中的节点的参数化资源输入310覆盖的输入空间不足以找到先前执行的过程运行中的某些过程变量之间的具有足够高置信度的相关性,或不足以找到任何相关性。在这些情况下,提供由参数化资源输入310覆盖的输入空间的建议值,以便测试相关性。在其他实例中,当根据对现有过程运行的分析标识潜在问题时,利用这种实施方案。在此类实施方案中,对运行数据存储中的过程运行中不存在的输入空间进行所建议的添加,所述添加将有利于确定潜在问题是否是真实的。如果潜在问题是真实的,则可以开发所述过程的新版本,其进一步定义到所述过程中的现有节点或新节点的输入或输出的状态(特性),以便尝试移除过程状态模糊性并且从而稳定所述过程。
在一些实施方案中,查询标识存在于运行数据存储中的运行中的一个或多个第三参数化输入和/或参数化输出,并且上述数值属性是第一参数化输入和/或输出与第三参数化输入和/或输出之间的相关性的置信度(644)。在一些实施方案中,所述一个或多个过程是多个过程,并且查询进一步标识其过程运行将由统计模块格式化的多个过程中的单个过程(646)。在此类实施方案中,由查询标识的所有过程运行制造相同的产品或产生相同形式的分析信息。
在一些实施方案中,查询进一步标识所述一个或多个过程中的过程运行的子集(648)。在此类实施方案中,不要求由查询标识的所有过程运行制造相同的产品或产生相同形式的分析信息。实际上,一些过程运行响应于查询可以制造不同的产品或产生不同类型的分析信息。
在一些实施方案中,统计模块进一步标识(i)包括运行数据存储中的一个或多个过程运行的第一集合与(ii)包括运行数据存储中的一个或多个过程运行的第二集合之间的相关性,其中在第二集合中的过程运行不在第一集合中(650)。例如,在一些实施方案中,跨越存在于第一集合和第二集合中的多个参数化输入和/或参数化输出来计算相关性(652)。
参考图6E,任选地,将一个或多个第一参数化资源输入和/或参数化资源输出导出到另一个装置以用于分析(654),例如作为一个或多个制表符分隔文件、CSV文件、EXCEL电子表格、GOOGLE表格,或以适合于SQL数据库的形式。
任选地,在一些实施方案中,如以上关于图5所讨论的,在一些实施方案中维持过程评估模块,当过程版本的超图中的节点的参数化资源输出集合中的参数化资源输出的输出特性的获得值超出输出规格极限时,所述过程评估模块以计算机数据传输的形式生成警报(656)。
任选地,在一些实施方案中,针对所述一个或多个过程中的相应过程执行数据驱动程序218(658)。数据驱动程序包括用于接收针对相应过程的数据集的指令,并且还包括用于解析所述数据集以便从而获得(i)运行数据存储中的过程运行的标识以及(ii)与过程运行的相应过程的超图中的第一节点的相应参数化资源输出集合相关联的输出特性值的指令。数据驱动程序还包括用于利用所解析的值填充运行数据存储中的第一节点的参数化资源输出的输出特性值的指令。例如,在一些实施方案中,与过程中的节点相关联的同步引擎监测相关联的同步文件夹。在一些实施方案中,与节点相关联的同步引擎作为附接到与节点相关联的仪器的任何PC上的后台进程(如Google Drive或Dropbox Sync)运行。当新的仪器数据文件被添加到文件夹时,软件解析所述数据并将其发送到数据驱动程序218。在一些实施方案中,通过与用户的交互来完成数据集与过程运行的正确协议变量(参数化资源输出)的关联,所述用户被呈现有包含他们可以访问的过程运行的选择的通知。在一些实施方案中,数据驱动程序218已经包含数据集中的值与过程运行的正确协议变量(参数化资源输入和/或输出)之间的关联。
在一些实施方案中,针对过程运行502的节点504传达到计算机系统的参数化资源输出集合314中的数据包括节点标识符406(例如,仪器标识符诸如蓝牙UUID)、过程版本404的标识以及参数化资源输入410的值。在一些实施方案中,数据呈JSON结构的形式。参见http://json.org/。
本公开的另一个方面提供计算机系统200,其包括一个或多个处理器274、存储器192/290、存储在所述存储器中以便由所述一个或多个处理器执行的一个或多个程序。所述一个或多个程序包括用于维持超图数据存储204的指令。对于所述一个或多个过程中的每个相应过程206,超图数据存储204包括相应过程的相应多个版本208。每个相应版本208包括超图302,所述超图302包括通过多个边缘中的边缘322连接的多个节点304。多个节点中的每个相应节点304包括表示对应过程206中的相应阶段的过程阶段标签306。多个节点中的每个相应节点304与到对应过程206中的相应阶段306的参数化资源输入集合308相关联。参数化资源输入集合308中的至少一个参数化资源输入310与一个或多个输入特性312相关联。所述一个或多个输入特性包括输入规格极限314。多个节点中的每个相应节点304还与到对应过程206中的相应阶段306的参数化资源输出集合314相关联。参数化资源输出集合314中的至少一个参数化资源输出316与一个或多个输出特性318相关联。一个或多个输出特性318包括对应的输出规格极限320。多个边缘中的每个边缘322指定多个节点中的节点304的参数化资源输出集合314包括在所述多个节点中的至少一个其他节点304的参数化资源输入集合308中。所述一个或多个程序还包括用于维持运行数据存储210的指令。运行数据存储210包括多个过程运行402。每个过程运行402包括:(i)用于所述一个或多个过程中的过程206的多个版本中的过程版本404的标识;(ii)相应版本208的超图302中的第一节点304的相应参数化输入集合408(图4)的值以及所述参数化输入的相关联输入特性410;(iii)第一节点304的相应参数化资源输出集合412;以及(iv)第一节点的相应参数化资源输出集合中的参数化资源输出414的至少一个输出特性416的获得值。所述一个或多个程序还包括用于维持统计模块212的指令,所述统计模块212响应于接收标识存在于运行数据存储中的一个或多个过程运行402中的一个或多个第一参数化输入和/或参数化输出的查询,格式化所述一个或多个第一参数化输入和/或参数化输出以用于统计分析。以这种方式,可以令人满意的再现性执行过程的实例(过程运行)。
引用的参考文献和替代实施方案
本文所引用的所有参考文献均以引用的方式整体并入本文,并且出于所有的目的,所述引用的程度就好像具体地和单独地出于所有的目的将各个公布或专利或专利申请以引用的方式整体并入。
本发明可以实现为包括嵌入在非暂时性计算机可读存储介质中的计算机程序机制的计算机程序产品。例如,所述计算机程序产品可包含以图1、图2、图3、图4和/或图5的任何组合示出的程序模块。这些程序模块可以存储在CD-ROM、DVD、磁盘存储产品或任何其他有形计算机可读数据或程序存储产品上。
在不背离本发明的精神和范围的情况下,可以对本发明进行许多修改和变化,这对本领域的技术人员来说是显而易见的。本文描述的具体实施方案仅作为实例提供。选择和描述实施方案是为了最佳地说明本发明的原理和其实际应用,并且由此使本领域的其他技术人员能够最佳地利用本发明以及具有如适于所涵盖的特定用途的各种修改的各种实施方案。本发明仅受随附权利要求书以及所述权利要求书授权的等效物的全部范围限制。