55] 在又一个方面,本发明的实施例涵盖用于评价自动化流式细胞术门的系统和方 法。示例性的方法可包括:获得针对该门的基于直方图的度量,以及基于该基于直方图的度 量来评价该自动化门。在其他方面,示例性的方法可包括获得针对该门的基于群体的度量, 以及基于该基于群体的度量来评价该自动化门。在另一个方面,本发明的实施例涵盖用于 将原始度量转换成加权度量的系统和方法。示例性的方法可包括:获得原始度量,获得与从 其获得该原始度量的数据相对应的显著性量度,以及基于该显著性量度将该原始度量转换 成加权度量。
【附图说明】
[0056] 图1示出根据本发明实施例的基于区域可分性直方图的度量技术的各方面。
[0057] 图2示出根据本发明实施例的用于确定区域可分性度量的技术的各方面。
[0058] 图3A示出根据本发明实施例的归一化之后的单峰钟形样品数据分布的各方面, 图3B示出根据本发明实施例的针对图3A的分布的归一化高斯曲线的各方面。
[0059] 图4A示出根据本发明实施例的归一化之后的多峰偏倚样品数据分布的各方面, 图4B示出根据本发明实施例的针对图4A的分布的归一化高斯曲线的各方面。
[0060] 图5A示出根据本发明实施例的样品数据与理论数据的比较。
[0061] 图5B示出根据本发明实施例的样品数据与理论数据的比较。
[0062] 图6A和图6B示出根据本发明实施例的数据分割技术的各方面。
[0063] 图7示出根据本发明实施例的群体度量技术的各方面。
[0064] 图8示出根据本发明实施例的可与细胞分析或流式细胞术系统相关联而实施的 一种或多种模块的各方面。
[0065] 图9示出根据本发明实施例的用于确定边界的品质评估度量的方法的各方面。
[0066]图10示出根据本发明实施例的用于确定将事件子集与集合中的其他事件分离的 边界或分割特征的品质评估度量的方法的各方面。
[0067] 图11示出根据本发明实施例的计算机系统的各方面。
【具体实施方式】
[0068] 本发明的实施例整体涉及对颗粒进行分析和分组的系统和方法。更具体地讲,本 发明的实施例涉及用于评价或评估用来对颗粒进行分类的分割技术的品质的系统和方法, 例如在由与颗粒的物理特性相关的数据创建了二维直方图的情况下。
[0069] 颗粒分析仪(例如血液分析仪或流式细胞仪)可以处理用于颗粒分析的生物样 品。它们可测量用于分析的生物样品中的生物颗粒的物理特性。示例性的物理特性测量包 括电光测量。测得的物理特性可被视为多维空间。该多维空间中的每个维度可与测得的一 种物理特性对应。共有相似物理特性的颗粒可归类为该多维空间中的群集。每个群集可与 特定的颗粒群体对应。由于颗粒具有统计分布且涉及多个维度,所以通过自动化的方法或 算法识别此类群集的过程通常是复杂的任务。
[0070] 本发明的一些实施例涵盖用于评估自动化分割算法结果以及手动分割结果的品 质的多种度量。例如,流式细胞术通常涉及用于将数据分离成不同部分的技术。本发明的 实施例包括用于评价或评估此类分割技术的结果的品质的方法。本文所公开的度量技术可 分为两类,以便包括基于直方图的度量和基于群体的度量。根据一些实施例,基于直方图的 度量是基于在已按一个或多个区域分割的个别单维或多维直方图上提取的特征计算的。
[0071] 根据一些实施例,基于群体的度量可针对作为流式细胞术平板的目标的所关注群 体中的每一个创建。在一些实施例中,基于群体的度量以遵循其分离所关注群体的门控顺 序、基于直方图的度量及其统计显著性、以及用于产生数值的集成算子为基础。
[0072] 在非限制性例子中,一种评估数据分割技术的品质的方法可以包括:获得累积事 件的集合的数据,以及使用数据分割技术分割所述累积事件的子集的数据。所述集合可对 应于样品颗粒,例如血液样品中的生物颗粒,而所述子集可对应于所关注群体。所述分割步 骤可产生数据分割结果,并且所述方法可包括基于数据分割结果确定所述数据分割技术的 品质。
[0073] 两种基于言方图的度量:厌域可分件和数据分布
[0074] 基于直方图的度量通常以提取自单个直方图的特征为基础。本发明的一些实施例 涵盖两种基于直方图的度量,具体地讲,为区域可分性得分和数据分布得分。区域可分性得 分在一些实施例中用于分析沿着区域边界的数据,而数据分布得分在某些实施例中用于分 析该区域内的数据的性态。
[0075] 在一些实施例中,这些度量被有效地用于以下情形:在直方图区域边界线的每一 侧的事件在某些情况下不类似地成比例,或者说是呈现预定义的数据分布模式。作为非限 制性例子,在一些实施例中,此类度量说明分离小群体的区域边界线,或说明在该边界线的 任一侧生成多峰分布时涉及不止一个群体的情况。
[0076] 厌域可分件度量(其为两种基于言方图的度量中的第一种)
[0077] 在一些实施例中,使用区域可分性度量来评估自动化或非自动化(例如,手动执 行的)方法所实现的分离的优良度,作为非限制性例子,当通过区域边界线分离落入直方 图的特定区域中的数据事件时。可通过本发明实施例评价的示例性的手动、自动化和其 他门控技术,边界决策、区域放置或直方图分割技术在以下文献中有所论述:Bashashati et al. "A Survey of Flow Cytometry Data Analysis Methods'',Advances in Bioinformatics, Volume 2009, Article ID 584603 (Bashashati 等人,"流式细胞术数据分 析方法的调查",《生物信息学进展》,第2009卷,文章编号584603),该文献的内容以引用方 式并入本文;以及美国专利公开No. 2010/01111400,该专利公开也以引用方式并入本文。
[0078] 作为非限制性例子,具有高分离优良度的区域边界线将该区域内部的所有事件的 距离最小化到一特征点(即,平均值、众数或任何其他参数),同时使这些事件到区域边界 线的距离最大化。因此,在一些实施例中,具有高分离优良度的区域边界线与分隔待分离事 件的最低直方图密度路径对应。在某些实施例中使用示例性的区域边界线可分性度量来在 流式细胞术应用中获得改善的分离,并相关地在某些实施例中使用该度量提供改进的区域 边界线放置。
[0079] 现在转到附图,图1示出根据本发明实施例的基于区域可分性直方图的度量技术 的各方面。如此处的二维直方图1〇〇(在一些实施例中,其源自门控事件;而在某些实施例 中,其源自非门控事件)中所示,被命名为CD36+的区域110及其相应的边界线120将直方 图100分成了两个单独的事件集合。CD36+区域110通过边界线120结合直方图边界的外 部界限(右侧130的最大⑶36FITC值,下侧140的最小⑶2+CRTH2PE值)进行限定。⑶36+ 区域将直方图分成了两个独立的数据集合。示出的原始数据包括所有事件,并且该区域将 事件分成了两个单独的集合,使得第一集合110位于该区域110的内部(CD36+),而第二集 合位于该区域的外部(非CD36+)。因此,该区域为将数据分成两个子集的形状。
[0080] 为了获得区域可分性度量,如公式1所表征的,对落在区域边界线(即,定义多边 形区域的线)上的门控事件的数量进行计数。作为非限制性例子,在一些实施例中,这涉及 确定落在限定CD36+区域的边界线120上的事件的数量。
[0081] 另外,获得正被分析的事件的总数量。在一些实施例中,该数量是指所有收集到的 事件的预定义子集。作为非限制性例子,在某些实施例中,正被分析的事件的总数量是指从 红细胞碎片分离后的白血细胞的数量。
[0082] 如图2所描绘的,在一些实施例中,随后使用方法200计算在区