基于人工智能的寄生虫检测方法、系统及终端设备与流程

文档序号:22616603发布日期:2020-10-23 19:17阅读:130来源:国知局
基于人工智能的寄生虫检测方法、系统及终端设备与流程

本发明涉及疾病诊断和微生物形态图像识别技术领域,以及人工智能领域,提供了一种寄生虫识别、检测方法及检测系统和检测设备。



背景技术:

常见的人兽共患寄生虫包括疟原虫、巴贝西虫、阿米巴原虫、杜氏利士曼原虫、弓形虫、伊氏锥虫等。疟疾目前在赤道附近的一个宽频带流行,在美洲地区、亚洲许多地区和非洲大部分地区;在撒哈拉以南非洲,85-90%的疟疾死亡病例发生。根据《2016年世界疟疾报告》,2016年全球疟疾病例约2.14亿例,疟疾死亡约43.8万人。这一负担在非洲地区最为沉重,据估计,该地区92%的疟疾死亡病例发生在该地区,而在5岁以下儿童中,疟疾死亡病例占所有死亡病例的三分之二以上。世卫组织估计,2018年新增疟疾病例2.28亿例,导致405000人死亡。大多数病例(65%)发生在15岁以下儿童。每年约有1.25亿孕妇面临感染风险;在撒哈拉以南非洲,母亲疟疾每年与估计多达20万婴儿死亡有关。世卫组织估计,2018年新增疟疾病例2.28亿例,导致405000人死亡。大多数病例(65%)发生在15岁以下儿童。每年约有1.25亿孕妇面临感染风险;在撒哈拉以南非洲,母亲疟疾每年与估计多达20万婴儿死亡有关。疟疾的早期诊断和治疗可减少疾病的传播,防止死亡。然而,对于低收入国家,卫生设施严重缺乏有经验的寄生虫学家。因此,这些地区或国家的死亡率下降的障碍之一是疟疾检测不准确。而对于寄生虫来说,其检测是具有致关重要的作用。目前,寄生虫的检测方法还存在着明显的缺陷,主要包括:

一是比较传统的镜检检测方法。通过染色将样本制成玻片,放在显微镜下观察形态特征,来判断是否存在寄生虫。但这种检测方法需要依赖于检测人员的专业水平,因而存在效率低、工作强度大、人员易疲劳等问题。一种是培养繁殖检测方法。就是在一定的营养条件下,培养样本中的微生物,观察繁殖扩增的生长特性来判断是否存在寄生虫。但培养方法中需要将寄生虫在培养基上生长18-24小时,周期较长,因而效率较低。另一种是抗原或抗体检测方法。通过向样本中注入特定抗体或者抗原,观察是否发生特异性反应,来判断是否存在寄生虫。这显然需要有明确的抗原抗体反应,需要针对不同的寄生虫分别需要明确的抗原抗体反应。在实际中,往往是有相对明确的寄生虫怀疑的情况下,选择对应的抗原抗体反应进行检测。相对来说比较高级是的方法基因检测。利用核酸杂交、基因芯片、聚合酶反应等技术,根据是否检测到寄生虫的特定核酸序列来判断是否存在寄生虫。这种方法相对来说成本较高,对偏远山区和不发达地区应用还不是十分普遍。

疟疾通常通过血液涂片或快速诊断试验(rdts)对血液进行显微镜检查来诊断。利用聚合酶链反应检测疟原虫dna的方法已经开发出来,但由于成本和复杂性,在疟疾常见的地区并没有得到广泛应用。利用明/亮视野显微镜观察吉姆萨染色的厚和/或薄血涂片,是目前国际上疟疾检测用血样评价的金标准和主要方法。薄血涂片可以提供阳性或阴性的筛选试验,以确定血液涂片中是否存在寄生虫。利用高倍率和高分辨率的白光显微成像技术,对血液涂片中的寄生虫种类进行鉴定和形态学评价。然而,除了训练有素的显微镜技术人员外,传统的白光显微镜通常还需要临床实验室结构,这在疟疾最普遍的地区都很少见。此外,根据专家显微镜技术人员的培训和使用的设备,目前的显微镜技术导致主观测量,据报告差异很大。

快速诊断试验(rdts)已在全世界得到广泛应用,为用手指抽血诊断疟疾提供了一种更便宜、更省时的替代方法。然而,目前用于疟疾检测的rdts包括基于抗原的检测方案。因此,由于感测化学的原因,rdt在热带地区的表现已经被报道为退化。此外,现有的rdts检测限往往远高于目前检测早期感染的金标准工具。此外,这些设备不能提供定量的寄生虫血症结果,而且在诊断菌株特异性疟疾感染方面表现不一致。此外,rdts对诊断低寄生虫密度无效。显然,缺乏经验丰富和技术熟练的显微镜是非洲预防疟疾目标需要立即解决的关键挑战。近期还有一些新的技术应用寄生虫的检测,如随着深度学习的发展,同时也出现一种利用深度学习的检测方式,但其数据采集采集设备为电镜,价格昂贵,阻碍了电镜的普遍利用,从而限制了深度学习在疟疾检测系统中的应用。此外,该方法采用了两种深度学习模型,过度利用计算资源,从而限制了该方法的普及。比如cn110807426a的中国专利申请涉及一种基于深度学习的寄生虫检测系统,其涉及到图像的处理技术。但这些现有技术的方法还缺乏现场直接检测的高效手段,并且检测准确率有待提高,本发明基于这种目的而开发完成的。



技术实现要素:

有鉴于此,本发明实施例提供了一种寄生虫检测方法、检测系统及终端设备,以解决现有技术中成本较高,且复杂性高,在低收入人群,或国家或边远地区,根本无法广泛应用的问题。本发明中所述寄生虫检测方法和系统中的检测模型为基于vgg(visualgeometrygroup)框架,优化后具有腾跃层(skipconnections)的人工智能(artificialintelligence,ai)诊断(diagnosis)模型,称为aidman模型。具体来说,本发明的寄生虫检测模型以vgg框架为基础进行优化改造,通过将编码器中的卷积层更改为深度空间卷积层,以降低模型的训练参数,从而减小运行时间;通过腾跃连接编码器与解码器,使不同尺度的特征进行融合,增加模型所学到的特征,从则增加系统的准确性。

因此,本发明首先提供一种寄生虫检测系统,其中寄生虫不局限于疟原虫、巴贝西虫、阿米巴原虫、杜氏利士曼原虫、弓形虫、伊氏锥虫等人兽共患寄生虫,且这些寄生虫感染后在宿主体内血细胞内部或周边形成具有环状体和/或滋养体形态,该系统包括:

图像采集模块,用于获取待检测图像;

去干扰模块,用于对所述待检测图像进行去干扰操作,得到去干扰后的待检测图像;

图像分割模块,用于对所述去干扰后的待检测图像进行分割,得到多个待检测的细胞图像;

图像分类模块,用于将所述多个待检测的细胞图像分别输入到训练后的寄生虫检测模型中,得到所述多个待检测的细胞图像分别对应的分类结果;

分类结果确定模块,用于若所述多个待检测的细胞图像分别对应的分类结果均为不存在寄生虫,则确定所述待检测图像中不存在寄生虫;若所述多个待检测的细胞图像中的任意一个待检测的细胞图像对应的分类结果为存在寄生虫,则确定所述待检测图像中存在寄生虫。

优选地,还包括结果显示模块。

在一个实施方式中,所述对所述待检测图像进行去干扰操作,得到去干扰后的待检测图像,包括:获取圆形的待检测图像的内接正方形的图像,作为所述去干扰后的待检测图像。

在一个优选实施方式中,所述对所述去干扰后的待检测图像进行分割,得到多个待检测的细胞图像,包括:

将所述去干扰后的待检测图像进行灰度化,得到灰度图像;

根据所述灰度图像得到灰度值统计图;其中,所述灰度值统计图的横坐标为灰度值,纵坐标为在所述灰度图像中,对应的灰度值出现的次数;

在所述灰度值统计图中,获取目标灰度值;其中,在第一灰度值和第二灰度值之间,所述目标灰度值对应的纵坐标值最小,所述第一灰度值对应的纵坐标和所述第二灰度值对应的纵坐标为所述灰度值统计图中的两个峰值;

根据所述目标灰度值,对所述去干扰后的待检测图像进行分割,得到多个待检测的细胞图像。

在一个具体实施方式中,所述寄生虫检测模型由下述方法获得:

获取训练样本集,所述训练样本集包括多个训练图像;

对各个训练图像分别进行去干扰操作,得到去干扰后的训练图像;

对各个去干扰后的训练图像分别进行分割,得到每个训练图像对应的多个训练细胞图像;其中,每个训练细胞图像均已标定为存在寄生虫或不存在寄生虫;

基于所述每个训练图像对应的多个训练细胞图像,对预先构建的寄生虫检测模型进行训练,得到训练后的寄生虫检测模型。

更优选地,所述寄生虫检测模型包括十三个深度空间卷积层和五个最大池化层;在解码过程中,所述寄生虫检测模型通过全连接层将各个维度的特征转换为相同大小的特征,并将所述相同大小的特征依次进行特征相加操作,得到多个特征和,并通过展平层和全连接层提取各个特征和的特征;在解码过程中,所述寄生虫检测模型通过softmax激活函数,对待检测的细胞图像进行分类。

所述寄生虫检测模型为基于vgg(visualgeometrygroup)框架,优化后具有腾跃层(skipconnections)的人工智能(artificialintelligence,ai)诊断(diagnosis)模型,称为aidman模型。具体来说,本发明的寄生虫检测模型以vgg框架为基础进行优化改造,通过将编码器中的卷积层更改为深度空间卷积层,以降低模型的训练参数,从而减小运行时间;通过腾跃连接编码器与解码器,使不同尺度的特征进行融合,增加模型所学到的特征,从则增加系统的准确性。

其中,所述检测的寄生虫是疟原虫、巴贝西虫、阿米巴原虫、杜氏利士曼原虫、弓形虫、伊氏锥虫中的一种进行训练分别获得相应寄生虫的训练模型,优选多种寄生虫的训练模型构成训练模型集,在检测时自动检测检测对像或提供选择检测哪一种寄生虫。

在一个实施方式中,所述图像采集模块包括直接读取或无线方式获得图像,优选地所述图像由移动终端如手机获取。

在具体实施方式中,所述分类结果显示模块将结果通过远程无线上传网络显示,或通过显示设备如果屏幕直接显示结果。

本发明还提供一种含有上述寄生虫检测系统的检测设备,其包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序,所述计算机程序编码实现上述寄生虫检测系统,优选地还包括配套的图像拍照设备如手机,以及显示设备如屏幕或者远程结果显示器。

同时,本发明还提供一种利用上述的检测设备用于寄生虫的检测方法,在检测时包括下述步骤或过程:

获取待检测图像;

对待检测图像进行去干扰操作,得到去干扰后的待检测图像;

对去干扰后的待检测图像进行分割,得到多个待检测的细胞图像;

将多个待检测的细胞图像分别输入到训练后的疟原虫检测模型中,得到多个待检测的细胞图像分别对应的分类结果;

若多个待检测的细胞图像分别对应的分类结果均为不存在疟原虫,则确定待检测图像中不存在疟原虫;

若多个待检测的细胞图像中的任意一个待检测的细胞图像对应的分类结果为存在疟原虫,则确定待检测图像中存在疟原虫。

其中所述检测可以是非诊断目的的,指并非针对人或动物活体为实施对象,例如从环境取样进行检测其中是否存在疟原虫,环境取样例如土壤、水样以及其他可能存在疟原虫的环境样品,如死亡的动物体等。

此外,本发明还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被一个或多个处理器执行时实现如第一方面疟原虫检测系统。

本发明实施例与现有技术相比存在的有益效果是:本发明首先获取待检测图像,对待检测图像进行去干扰操作,得到去干扰后的待检测图像,可以减小待检测图像的大小,从而减少后续的计算量;然后对去干扰后的待检测图像进行分割,得到多个待检测的细胞图像,并将多个待检测的细胞图像分别输入到训练后的疟原虫检测模型中,得到多个待检测的细胞图像分别对应的分类结果,根据上述分类结果确定待检测图像中是否存在疟原虫,通过疟原虫检测模型可以自动对待检测图像进行分类,能够较少人力劳动;本发明能够节约成本,降低疟原虫检测的复杂性,在低收入国家,能够得到广泛应用。

附图说明

为了更清楚地说明本发明的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明的疟原虫检测方法的实现流程示意图;

图2是本发明的图像处理过程中各个图像的示意图(应用实施例一);

图3是本发明的疟原虫检测模型的结构示意图;

图4是本发明的疟原虫检测系统的结构示意图;

图5是本发明的终端设备的结构示意图。

图6应用实施例一中的roc曲线图。

图7a应用实施例二中部分未感染者的图片和rdt的诊断结果。

图7b应用实施例二中感染者的图片和rdt的诊断结果。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。

为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。

图1是本发明一实施例提供的寄生虫检测方法的实现流程示意图,为了便于说明,仅示出了与本发明实施例相关的部分。本发明实施例的执行主体可以是终端设备的检测设备。其中,所述寄生虫例如是疟原虫、巴贝西虫、阿米巴原虫、杜氏利士曼原虫、弓形虫、伊氏锥虫,即本发明适用检测这些寄生虫。

如图1所示,上述寄生虫检测方法可以包括如下步骤:

s101:获取待检测图像。

在本发明的一个实施例中,上述s101可以包括以下步骤:

通过移动终端摄像头和微距镜头,采集待检测图像。

其中,移动终端可以是手机等带摄像头的移动设备。通过手机和微距镜头即可采集图像,可以降低采集图像的成本。当采集图像时,将目标置于镜头中央。

可选地,微距镜头可以替换为光学显微镜。

s102:对待检测图像进行去干扰操作,得到去干扰后的待检测图像。

在本发明的一个实施例中,待检测图像为圆形图像;上述s102可以包括以下步骤:

获取圆形的待检测图像的内接正方形的图像,作为去干扰后的待检测图像。

s103:对去干扰后的待检测图像进行分割,得到多个待检测的细胞图像。

在本发明的一个实施例中,上述s103可以包括以下步骤:

将去干扰后的待检测图像进行灰度化,得到灰度图像;

根据灰度图像得到灰度值统计图;其中,灰度值统计图的横坐标为灰度值,纵坐标为在灰度图像中,对应的灰度值出现的次数;

在灰度值统计图中,获取目标灰度值;其中,在第一灰度值和第二灰度值之间,目标灰度值对应的纵坐标值最小,第一灰度值对应的纵坐标和第二灰度值对应的纵坐标为灰度值统计图中的两个峰值;

根据目标灰度值,对去干扰后的待检测图像进行分割,得到多个待检测的细胞图像。

s104:将多个待检测的细胞图像分别输入到训练后的寄生虫检测模型中,得到多个待检测的细胞图像分别对应的分类结果。

在本发明实施例中,将多个待检测的细胞图像分别输入到训练后的寄生虫检测模型中,可以得到各个待检测的细胞图像分别对应的分类结果,该分类结果为存在寄生虫或不存在寄生虫。

在本发明的一个实施例中,在上述s104之前,上述寄生虫检测方法还可以包括以下步骤:

获取训练样本集,训练样本集包括多个训练图像;

对各个训练图像分别进行去干扰操作,得到去干扰后的训练图像;

对各个去干扰后的训练图像分别进行分割,得到每个训练图像对应的多个训练细胞图像;其中,每个训练细胞图像均已标定为存在寄生虫或不存在寄生虫;

基于每个训练图像对应的多个训练细胞图像,对预先构建的寄生虫检测模型进行训练,得到训练后的寄生虫检测模型。

其中,训练样本集中的训练图像也可以是专业人员通过手机和微距镜头采集得到的。对训练图像的去干扰操作与上述对待检测图像的去干扰操作相同,对去干扰后的训练图像进行分割的过程与上述对去干扰后的待检测图像进行分割的过程相同,在此不再赘述。每个训练图像对应的分割后的多个训练细胞图像均由专家标记为存在寄生虫或不存在寄生虫,以便于对寄生虫检测模型进行训练。

在本发明的一个实施例中,本发明的模型由编码器和解码器两部分组成。模型以vgg为基础进行改进,通过将编码器中的卷积层更改为深度空间卷积层,以降低模型的训练参数,从而减小运行时间;通过腾跃连接编码器与解码器,使不同尺度的特征进行融合,增加模型所学到的特征,从则增加系统的准确性。模型具体结构如下所示:在编码过程中,寄生虫检测模型包括十三个深度空间卷积层和五个最大池化层;在解码过程中,寄生虫检测模型通过全连接层将各个维度的特征转换为相同大小的特征,并将相同大小的特征依次进行特征相加操作,得到多个特征和,并通过展平层和全连接层提取各个特征和的特征;在解码过程中,寄生虫检测模型通过softmax激活函数,对待检测的细胞图像进行分类。

具体地,图3为寄生虫检测模型的结构示意图,如图3所示,31为输入层,32为深度空间卷积层,33为最大池化层,34为展平层,35为全连接层,36为加法运算,37为舍弃层,38为输出层。

寄生虫检测模型,在编码过程中,包括十三个深度空间卷积层和五个最大池化层。假设输入为维度为n的特征向量,若采用(3,3)的卷积核,步长为1,输出维度为m的深度空间卷积层,所需的训练参数为(3*3*n+1*1*m)个;若采用(3,3)的卷积核,步长为1,输出维度为m的卷积层,所需的训练参数为(3*3*n*m)个。因此,用深度空间卷积层替换卷积层可以大大减少训练参数,缩短训练时长。

寄生虫检测模型,在解码过程中,采用全连接层将四个维度的特征转换为相同大小的特征,并将四个相同大小的特征进行特征相加操作,得到三个特征和,即第一个特征与第二个特征相加得到第一个特征和,第一个特征和第三个特征相加得到第二个特征和,第二个特征和第四个特征相加得到第三个特征和。之后采用展平层和全连接层提取各个特征和的特征。通过这种跳层的连接方式,学习多个尺度的特征,而非仅通过最后一个特征对图像进行判断,从而可以更准确地进行判断,能够提高寄生虫检测的准确性。最后通过softmax激活函数,对待检测的细胞图像进行分类,确定待检测的细胞图像中是否存在寄生虫。

在本发明的一个实施例中,寄生虫检测模型为基于vgg架构,改造优化具有腾跃层(skipconnections)的人工智能(artificialintelligence,ai)诊断(diagnosis)模型,称为aid模型。

s105:若多个待检测的细胞图像分别对应的分类结果均为不存在寄生虫,则确定待检测图像中不存在寄生虫;若多个待检测的细胞图像中的任意一个待检测的细胞图像对应的分类结果为存在寄生虫,则确定待检测图像中存在寄生虫。

通过多个待检测的细胞图像的分类结果可以确定待检测图像中是否存在寄生虫,进而确定待检测图像对应的人员是否患疟疾(是否已被寄生虫感染)。具体地,若多个待检测的细胞图像中均不存在寄生虫,则确定待检测图像中不存在寄生虫,即待检测图像对应的人员未患疟疾;若多个待检测的细胞图像中的任意一个待检测的细胞图像中存在寄生虫,则确定待检测图像中存在寄生虫,即待检测图像对应的人员患疟疾。

由上述描述可知,本发明实施例首先获取待检测图像,对待检测图像进行去干扰操作,得到去干扰后的待检测图像,可以减小待检测图像的大小,从而减少后续的计算量;然后对去干扰后的待检测图像进行分割,得到多个待检测的细胞图像,并将多个待检测的细胞图像分别输入到训练后的寄生虫检测模型中,得到多个待检测的细胞图像分别对应的分类结果,根据上述分类结果确定待检测图像中是否存在寄生虫,通过寄生虫检测模型可以自动对待检测图像进行分类,能够较少人力劳动;本发明能够节约成本,降低寄生虫检测的复杂性,在疟疾多发的非洲等低收入地方以及缺少经验丰富和技术熟练的疟疾检测专家的地方,能够得到广泛引用,进而可以挽救更多生命。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明的实施过程构成任何限定。

对应于上述寄生虫检测方法,本发明实施例还提供了一种寄生虫检测系统。图4是本发明一实施例提供的寄生虫检测系统的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分。

参见图4,对应的寄生虫检测系统400可以包括:图像采集模块401、去干扰模块402、图像分割模块403、图像分类模块404和分类结果确定模块405。

其中,图像采集模块401,用于获取待检测图像;

去干扰模块402,用于对所述待检测图像进行去干扰操作,得到去干扰后的待检测图像;

图像分割模块403,用于对所述去干扰后的待检测图像进行分割,得到多个待检测的细胞图像;

图像分类模块404,用于将所述多个待检测的细胞图像分别输入到训练后的寄生虫检测模型中,得到所述多个待检测的细胞图像分别对应的分类结果;

分类结果确定模块405,用于若所述多个待检测的细胞图像分别对应的分类结果均为不存在寄生虫,则确定所述待检测图像中不存在寄生虫;若所述多个待检测的细胞图像中的任意一个待检测的细胞图像对应的分类结果为存在寄生虫,则确定所述待检测图像中存在寄生虫。

可选地,待检测图像为圆形图像;

去干扰模块402具体用于:

获取圆形的待检测图像的内接正方形的图像,作为所述去干扰后的待检测图像。

可选地,图像分割模块403具体用于:

将所述去干扰后的待检测图像进行灰度化,得到灰度图像;

根据所述灰度图像得到灰度值统计图;其中,所述灰度值统计图的横坐标为灰度值,纵坐标为在所述灰度图像中,对应的灰度值出现的次数;

在所述灰度值统计图中,获取目标灰度值;其中,在第一灰度值和第二灰度值之间,所述目标灰度值对应的纵坐标值最小,所述第一灰度值对应的纵坐标和所述第二灰度值对应的纵坐标为所述灰度值统计图中的两个峰值;

根据所述目标灰度值,对所述去干扰后的待检测图像进行分割,得到多个待检测的细胞图像。

可选地,寄生虫检测系统200还可以包括:训练模块。

训练模块,用于获取训练样本集,所述训练样本集包括多个训练图像;对各个训练图像分别进行去干扰操作,得到去干扰后的训练图像;对各个去干扰后的训练图像分别进行分割,得到每个训练图像对应的多个训练细胞图像;其中,每个训练细胞图像均已标定为存在寄生虫或不存在寄生虫;基于所述每个训练图像对应的多个训练细胞图像,对预先构建的寄生虫检测模型进行训练,得到训练后的寄生虫检测模型。

可选地,在编码过程中,所述寄生虫检测模型包括十三个深度空间卷积层和五个最大池化层;在解码过程中,所述寄生虫检测模型通过全连接层将各个维度的特征转换为相同大小的特征,并将所述相同大小的特征依次进行特征相加操作,得到多个特征和,并通过展平层和全连接层提取各个特征和的特征;在解码过程中,所述寄生虫检测模型通过softmax激活函数,对待检测的细胞图像进行分类。

所述寄生虫检测模型为为基于vgg架构,改造优化具有腾跃层(skipconnections)的人工智能(artificialintelligence,ai)诊断(diagnosis)模型,称为aidman模型。其中,所述检测的寄生虫是疟原虫、巴贝西虫、阿米巴原虫、杜氏利士曼原虫、弓形虫、伊氏锥虫中的一种进行训练分别获得相应寄生虫的训练模型,更具体的可以是单一训练模型,如针对疟原虫的训练模型。也可以是将多种寄生虫的训练模型构成训练模型集,在检测时自动检测检测对像或提供选择检测哪一种寄生虫。

可选地,图像采集模块401具体用于:

通过移动终端摄像头和微距镜头,采集待检测图像。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述寄生虫检测系统的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

图5是本发明一实施例提供的终端检测设备的示意框图。如图5所示,该实施例的终端设备500包括:一个或多个处理器501、存储器502以及存储在所述存储器502中并可在所述处理器501上运行的计算机程序503。所述处理器501执行所述计算机程序503时实现上述各个寄生虫检测方法实施例中的步骤,例如图1所示的步骤s101至s105。或者,所述处理器501执行所述计算机程序503时实现上述寄生虫检测系统实施例中各模块/单元的功能,例如图4所示模块401至405的功能。

示例性地,所述计算机程序503可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器502中,并由所述处理器501执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序503在所述终端设备500中的执行过程。例如,所述计算机程序503可以被分割成图像采集模块、去干扰模块、图像分割模块、图像分类模块和分类结果确定模块,各模块具体功能如下:

图像采集模块,用于获取待检测图像;

去干扰模块,用于对所述待检测图像进行去干扰操作,得到去干扰后的待检测图像;

图像分割模块,用于对所述去干扰后的待检测图像进行分割,得到多个待检测的细胞图像;

图像分类模块,用于将所述多个待检测的细胞图像分别输入到训练后的寄生虫检测模型中,得到所述多个待检测的细胞图像分别对应的分类结果;

分类结果确定模块,用于若所述多个待检测的细胞图像分别对应的分类结果均为不存在寄生虫,则确定所述待检测图像中不存在寄生虫;若所述多个待检测的细胞图像中的任意一个待检测的细胞图像对应的分类结果为存在寄生虫,则确定所述待检测图像中存在寄生虫。

其它模块或者单元可参照图4所示的实施例中的描述,在此不再赘述。

所述终端设备500可以是桌上型计算机、笔记本、掌上电脑、手机、嵌入式设备及云端服务器等计算设备。所述终端设备500包括但不仅限于处理器501、存储器502。本领域技术人员可以理解,图5仅仅是终端设备500的一个示例,并不构成对终端设备500的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备500还可以包括输入设备、输出设备、网络接入设备、总线等。

所述处理器501可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器502可以是所述终端设备500的内部存储单元,例如终端设备500的硬盘或内存。所述存储器502也可以是所述终端设备500的外部存储设备,例如所述终端设备500上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器502还可以既包括终端设备500的内部存储单元也包括外部存储设备。所述存储器502用于存储所述计算机程序503以及所述终端设备500所需的其他程序和数据。所述存储器502还可以用于暂时地存储输入的相关数据,如通过远程传入或直接输入图像采集模块所获得的图像信息及样品相关信息等。所述存储器502还可以用于暂时地存储已经输出或者将要输出的数据,最终通过分类结果显示模块将结果通过远程无线上传网络显示,或通过显示设备如果屏幕直接显示结果。

应用实施例

应用实施例一

在一个实际例子检测样品中,样品来自非洲塞拉利昂中塞友好医院的120名当地患者的血液涂片,通过手机(华为meta20x)获取待测样品的图像。s101采集的图像均为圆形图像,采集的图像的分辨率为3648*2736。如图2所示,图2最左侧图像为采集的待检测图像,图2从左侧数第二个图像为去干扰后的待检测图像。在待检测图像中间截取其内接正方形的图像作为去干扰后的待检测图像,其余部分舍去。

当用手机采集图像时,会出现一些干扰因素,而需要的是位于图像中间的部分,因此截取图像的内接正方形的图像作为后续检测的目标,其大小为1733*1733。这样可以避免圆形与黑色边框切相接部分的细胞的干扰,同时减小图像的尺寸,可以减少后续计算量,减少后续步骤对计算机资源的占用。在这个例子中,首先对去干扰后的待检测图像进行灰度化处理,得到灰度图像。然后,统计灰度图像中,每个灰度值出现的次数,得到灰度值统计图。其中灰度图像中,灰度值(像素值)的范围为0~255。如图2中左起第三个图像为灰度值统计图,其横坐标为从0开始至255的连续整数灰度值,纵坐标为对应横坐标的灰度值在灰度图像中出现的次数。

由于细胞区域与细胞外区域的颜色差距较大,且细胞区域与细胞外区域在图像中占大部分,细胞边沿部分占少部分,因此,选择图2第三幅图像中,两个峰值之间的纵坐标最小值对应的横坐标的灰度值作为图像分割的依据,进行图像分割,将细胞区域与细胞外区域进行分割,只保留细胞区域。其中,分割后的多个待检测的细胞图像如图2中左数第四个图像。将所述经过分割模块后的细胞图片的图像传入检测系统中,发现分割后的照片中不存在疟原虫感染的细胞,因此这张样本图片并未被疟原虫感染。

本系统在十折验证中的指标如表所示,模型通过预测1709张从未在训练集中出现过的细胞图像所得到的表中指标,模型在这1709张图片中,预测正确的平均个数为1592个,预测错误的平均个数为137个。本系统所采用的模型具有良好准确率(accuracy,99.20±0.49%),精度率(sensitivity,99.21±0.49%),特异度(specificity,99.04±1.02%),召回率(precision,99.21±0.49%)和auc=99.94±0.09。其中auc(areaundercurve)为roc曲线下得面积,可以表示预测正样本正确的概率大于预测负样本错误的概率,即auc越大,模型预测的越准确。这些指标的平均值均大于99%,且roc曲线下的面积越大说明模型准确率越高,从图6可以看到roc曲线下的面积基本等于这个坐标系所围成的矩形,因此,可以证明本系统的预测准确性极高,出现误差的较低。这些指标均是通过混淆矩阵计算得到,混淆矩阵中:tp为标签为正样本,模型预测结果同为正样本的数量;fn为标签为正样本,模型预测结果为负样本的数量;fp为标签为负样本,模型预测结果为正样本的数量;tf为标签为负样本,模型预测结果同为负样本的数量。准确率=(tp+tn)/(tp+tn+fp+fn)其含义为分类模型所有判断正确的结果占总观测值的比重;精度率=tp/(tp+fp)其含义为分类模型预测为正样本的结果中,预测正确的比重;召回率=敏感性=tp/(tp+fn)其含义为在真实值为正样本的所有结果中,模型预测正确的比重;特异度=tn/(tn+fp)其含义为在真实值为负样本的所有结果中,模型预测正确的比重,f1分数=2*精度率*召回率/(精度率+召回率)其含义是精度率和召回率的调和平均数,用来衡量系统的性能。roc(receiveroperatingcharacteristic)曲线根据模型得预测结果,将阈值从0到1,即刚开始将预测得每个样本视为正样本,随着阈值得增大,模型预测为正样本得的数量越少,直到最后预测结果全部小于或等于最大阈值1,在这一过程中每次计算出两个重要的值,分别作为roc曲线的横纵坐标。横坐标fpr(falsepositiverate)=fp/(tn+fp),纵坐标tpr(truepositiverate)=tp/(tp+fn)。结果见下表以及图6。

应用实施例二

本实施例为应用本发明的检测结果与rdt检测和专家检测结果分析。基于塞拉利昂中塞友好医院的38名患者的手机图片进行结果分析(华为meta20x,采集的图像的分辨率为3648*2736。这些患者的涂片此前从未用于开发模型。经过染色后的细胞,若已被疟原虫感染则会呈现紫色圆环状、或紫色香蕉状等具有明显寄生虫相关特征的形状;若细胞未被疟原虫感染则细胞未被染色或因染色过程不够完美所呈现出不规则的紫色图形。专家对着38名患者的检测结果为,其中20人为感染者,18人为未感染者。在ai模型中,当患者的图片中见到至少一个含有寄生虫的单个红细胞时,则判定该患者被感染。aidman模型的预测结果在20位感染者中检出19人被感染,只有一个图片被误判。此外18位未感染着的图片均被ai模型判断正确。重要的是,本发明的aidman模型检测到rdt报告的阴性结果中含有两个阳性涂片,rdt报告的阳性结果中包括两个阴性图片(见图7a和图7b)。结果表明本发明的算法与专家检测的结果完全相同,而rdt的检测结果相对于专家的诊断结果的准确率位89.47%。因此,本发明的aidman模型的性能与专家相当,具备非常实用的价值。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。

以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1