基于概率分布细胞分类统计方法

文档序号:9450973阅读:371来源:国知局
基于概率分布细胞分类统计方法
【技术领域】
[0001] 本发明涉及人体血细胞检测不同类型细胞分类识别技术,特别是一种基于概率分 布细胞分类统计方法。
【背景技术】
[0002] 随着医学临床要求的不断提高,对于人体血细胞的识别和划分要求更为细致和准 确。目前五分类血液分析仪得到了各级医疗单位的青睐,五分类血液细胞分析仪是根据 细胞的内外部结构特征将白细胞划分成五个亚群,其具体包括淋巴细胞(Lym)、单核细胞 (Mon)、中性粒细胞(Neu)、嗜酸粒细胞(Eos)、嗜碱粒细胞(Baso)。现阶段大部分仪器厂商 采用层流技术结合光学检测的方式,高端五分类机型利用荧光和散射光组合成超过三维信 号将白细胞进行五分群,中低端五分类机型利用散射光形成二维及三维散射信号,将白细 胞分为四个亚群,另外一类亚群(Baso)则是通过传统的阻抗法进行计数统计。相对早期 的散点图分类方法大多采用的是固定区域法,例如专利US4727020、US4599307中提到的利 用设置区域界限的方式将样本空间划分为不同种类,落在同一区域的样本认为是同一类细 胞。但由于区域界限为固定的,不能随实际样本分布情况变化,就会导致准确性不过高,适 用性不够普遍。专利US5627040引入了重心引力因子可以自动调整区域边界,但各个区域 的方位、大小和形状依然是固定的,虽然解决了固定区域法的部分弊端,但适用性仍不够普 遍。专利CN101226190采用了 K-Means聚类算法,先指定几个亚群的质心,计算每个样本点 到各个质心的有效距离,选择距离最近的就将该样本点归于该亚群;重新计算各个亚群的 质心,再迭代重复计算上几步,直到各个亚群的质心位置不在变化。其中有效距离可以选择 欧式距离、绝对距离、Minkowski距离、Chebyshev距离、方差加权距离和马氏距离中任意一 种。该种方法只需要对初始聚类质心点选择合适,就能准确的对各个亚群准确分类。但该 方法比较适合"球类"聚类分布的样本,对"非球类"聚类分布的样本分类结果有比较大的 偏差。专利CN103776751通过需找闭合等高线来确定各个亚群的分界线,能够处理不规则 的边界,能够提高分类的精度,但对与边界有重叠的亚群就容易被识别为同一亚群,从而产 生误判。

【发明内容】

[0003] 本发明的目的是提供一种能够细致和准确地对多维细胞散点图不同亚群的区分 和统计的分类统计方法。
[0004] 本发明的目的是通过如下途径实现的:
[0005] 基于概率分布细胞分类统计方法,其特征是包括以下步骤:
[0006] A.对原始散点图进行初始划分,确认亚群种类;
[0007] B.分别计算各个亚群的高斯分布特征参数,并计算最大对数似然函数值;
[0008] C.进入迭代计算,根据上次迭代输出的高斯分布函数,计算各细胞处于各个亚群 的概率分布;
[0009] D.根据各细胞概率分布重新计算各个亚群的高斯分布特征参数,并计算最大对数 似然函数值;
[0010] E.判定最大对数似然函数值是否收敛,若不收敛,则重复步骤C和D继续迭代计 算,若收敛,则终止迭代,输出各亚群高斯分布特征参数和各细胞亚群类型。
[0011] 所述对原始散点图进行初始划分是对原始散点图进行去噪处理,根据直方图趋势 寻找血影分界线,去除血影,对原始散点图进行初始分类,确认亚群种类。
[0012] 所述计算各个亚群的高斯分布特征参数是:
[0013]
[0014]K为白细胞亚群的数量,3ik为每个亚群的权重,N(x| yk,E k)为每个亚群的高斯 概率密度分布函数,yk均值,E 方差;
[0015] 对数似然函
i用分步迭代的方法来进行参数估计,第 k个亚群产生的概率为
[0016] 对应的特征参数分别为

[0017] 重复迭代前面两步,直到对数似然函数收敛。
[0018] 本发明的积极效果:本发明基于概率分布细胞分类统计方法对散点图初始分界线 划分的准确性要求较低,降低了算法的复杂度,自适应能力强,提高了粒子分类的准确性和 稳定性,能够细致和准确地实现对多维细胞散点图不同亚群的区分和统计。
【附图说明】
[0019] 图1为本发明细胞分类算法流程图
[0020] 图2为本发明二维原始散点图
[0021] 图3为本发明散点图血影分界线图
[0022] 图4为本发明散点图各亚群初始分界线图
[0023]图5为本发明散点图各亚群分布范围图
[0024] 图6为本发明散点图分类结果图
[0025] 图7为本发明细胞分类检测装置示意图
【具体实施方式】
[0026] 下面结合说明书附图对本发明作详细说明:
[0027] 本发明基于概率分布细胞分类统计方法涉及到的细胞分类检测装置分为3个部 分组成:前光整形组件、样本整流组件和散射光收集组件,如图7所示,前光整形组件主要 功能是对照射光束进行整形处理,让照射光斑匹配到试剂处理后白细胞大小;样本整流组 件主要功能是保证试剂处理过的白细胞一字排列依次通过照射光斑,产生散射光信号;散 射光收集组件主要功能是将划分的各个区域(至少两个区域)的散射光信号转化为电脉冲 信号,并识别对应的峰值点形成样本集合。对于上述分类检测装置得到的白细胞样本集合, 根据中心极限定理,可以近似的认为白细胞各亚群(淋巴、单核、中性粒、嗜酸粒)都服从均 值为y k,方差为高斯正态分布。如图1所示,为细胞分类算法流程图。以二维散射 信号样本集合为例,均值y为K维二列的数组,协方差矩阵E为2X2的方阵,对细胞散点 图分类统计算法具体步骤为:
[0028] 1)将识别的散射脉冲信号峰值数据变换到二维空间中,形成白细胞原始散点图, 如图2所示,为低角散射信号(FLS)和中低角散射信号(FMS)形成的二维原始散点图。
[0029] 2)对原始散点图进行去噪处理,利用邻域内非零点数和粒子总数来进行判定,不 符合条件将该点去掉;对去噪过后的散点图分别在低角(FLS)和中低角(FMS)方向投影生 成直方图,根据直方图趋势寻找血影分界线,去除血影。如图3所示,对散点图在FLS方向生 成投影直方图,寻找到截止点,寻找
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1