一种基于机器学习的医学图像分类方法及系统与流程

文档序号:21697913发布日期:2020-07-31 22:49阅读:672来源:国知局
一种基于机器学习的医学图像分类方法及系统与流程

本发明涉及医学图像分类领域,特别是涉及一种基于机器学习的医学图像分类方法及系统。



背景技术:

由于医学图像中蕴含着丰富的图像和医学信息,近年来面向医学图像的数据挖掘技术成为医学和计算机交叉学科研究的热点。随着医疗数字化设备的快速发展,医学信息数据库被广泛使用。病人的结构化文本信息,以及大量的非结构化医学图像信息,为医学图像的数据挖掘提供了丰富的数据资源。

医学图像可以有效的辅助医师在诊断过程中对病理变化区域进行检测、定位以及判断它的良恶性,因此被广泛应用于临床诊断过程中。然而,具有不同知识背景的医生即使对同一张医学图像可能存在不同的判断,所以,运用数据挖掘方法研究医学图像分类算法,对辅助医生根据医学图像进行诊断,提高其效率和精度,具有较高的学术价值和实际应用前景。

目前,随着人工智能的发展,机器学习作为人工智能核心技术得到了广泛的应用,尤其是在医学图像分类方面。当前常用的机器学习算法包括神经网络、支持向量机(svm)、决策树、朴素贝叶斯分类器、随机森林、极限学习机(elm)等。

卷积神经网络(cnn)作为神经网络的一种,在医学图像分类识别中得到了广泛的应用。cnn通过卷积层、池化层等变换,能够自动得到图像在不同尺度下的特征值,避免了复杂的手工特征提取,是一个较好的特征提取器。cnn的最后一层通常采用全连接或svm作为分类器,但是全连接与svm均具有计算复杂度高的缺点。

elm由于只含有一个隐藏层,且输入层与隐藏层的权重值和偏置值不需要进行迭代更新,elm相比svm等算法,虽然具有计算复杂度低、训练速度快的优点,但是其随机产生输入层与隐藏层的网络权重值和偏置值会造成elm对未在训练集中出现的样本泛化能力差、输出结果不稳定,不能达到理想的精度。

综上,现有的医学图像分类方法存在时间复杂度较高、分类准确率较低的问题。



技术实现要素:

基于此,有必要提供一种基于机器学习的医学图像分类方法及系统,以实现在提高分类效率的同时,提高分类的准确度。

为实现上述目的,本发明提供了如下方案:

一种基于机器学习的医学图像分类方法,包括:

获取医学图像测试集;所述医学图像测试集由多个医学图像测试样本组成;

将所述医学图像测试集输入至训练好的卷积神经网络特征提取网络中,得到测试特征初始集;所述训练好的卷积神经网络特征提取网络包括输入层、输出层、多个卷积层和多个池化层;所述测试特征初始集由多个医学图像测试初始特征组成;所述医学图像测试初始特征是所述训练好的卷积神经网络特征提取网络中的卷积层输出的特征;

对所述测试特征初始集进行对齐融合和特征降维,得到测试特征集;所述测试特征集由多个尺寸相同的医学图像测试特征组成;

采用自助抽样法依次对所述医学图像测试集和所述测试特征集进行随机抽样,得到多个测试样本子集;

将所述测试样本子集输入至对应的训练好的极限学习机模型中,得到测试集初始分类结果;一个所述测试样本子集对应一个所述训练好的极限学习机模型;一个所述训练好的极限学习机模型对应一个所述测试集初始分类结果;

将多个所述测试集初始分类结果输入至训练好的随机森林模型中,得到医学图像测试集分类结果。

可选的,所述训练好的卷积神经网络特征提取网络的确定方法为:

获取医学图像训练集;所述医学图像训练集由多个医学图像训练样本和对应的类标签组成;

构建卷积神经网络模型;所述卷积神经网络模型包括待定参数的输入层、待定参数的输出层、待定参数的全连接层、多个待定参数的卷积层和多个待定参数的池化层;

将所述医学图像训练集输入至所述卷积神经网络模型中,确定每个层的待定参数,得到训练好的卷积神经网络模型;

去除所述训练好的卷积神经网络模型中的全连接层,得到训练好的卷积神经网络特征提取网络。

可选的,所述训练好的极限学习机模型的确定方法为:

获取医学图像训练集;所述医学图像训练集由多个医学图像训练样本和对应的类标签组成;

将多个所述医学图像训练样本输入至训练好的卷积神经网络特征提取网络中,得到训练特征初始集;所述训练特征初始集由多个医学图像训练初始特征组成;所述医学图像训练初始特征是所述训练好的卷积神经网络特征提取网络中的卷积层输出的特征;

对所述训练特征初始集进行对齐融合和特征降维,得到训练特征集;所述训练特征集由多个尺寸相同的医学图像训练特征组成;

采用自助抽样法依次对所述医学图像训练集和所述训练特征集进行随机抽样,得到多个训练样本子集;

构建参量待定的极限学习机模型;

将每个所述训练样本子集分别输入至所述参量待定的极限学习机模型中,得到多个训练好的极限学习机模型。

可选的,所述训练好的随机森林模型的确定方法为:

获取医学图像训练集;所述医学图像训练集由多个医学图像训练样本和对应的类标签组成;

将多个所述医学图像训练样本输入至训练好的卷积神经网络特征提取网络中,得到训练特征初始集;所述训练特征初始集由多个医学图像训练初始特征组成;所述医学图像训练初始特征是所述训练好的卷积神经网络特征提取网络中的卷积层输出的特征;

对所述训练特征初始集进行对齐融合和特征降维,得到训练特征集;所述训练特征集由多个尺寸相同的医学图像训练特征组成;

采用自助抽样法依次对所述医学图像训练集和所述训练特征集进行随机抽样,得到多个训练样本子集;

将所述训练样本子集输入至对应的训练好的极限学习机模型中,得到训练集初始分类结果;一个所述训练样本子集对应一个所述训练好的极限学习机模型;一个所述训练好的极限学习机模型对应一个所述训练集初始分类结果;

构建参量待定的随机森林模型;

将多个所述训练集初始分类结果作为所述参量待定的随机森林模型的输入,将对应训练样本子集中类标签作为所述参量待定的随机森林模型的输出,对所述参量待定的随机森林模型进行训练,得到训练好的随机森林模型。

可选的,所述对所述测试特征初始集进行对齐融合和特征降维,得到测试特征集,具体包括:

采用最近邻差值法对所述测试特征初始集进行对齐融合,得到测试融合特征集;所述测试融合特征集内的特征的尺寸均相等;

采用主成分分析法对所述测试融合特征集进行特征降维,得到测试特征集。

本发明还提供了一种基于机器学习的医学图像分类系统,包括:

测试集获取模块,用于获取医学图像测试集;所述医学图像测试集由多个医学图像测试样本组成;

初始特征提取模块,用于将所述医学图像测试集输入至训练好的卷积神经网络特征提取网络中,得到测试特征初始集;所述训练好的卷积神经网络特征提取网络包括输入层、输出层、多个卷积层和多个池化层;所述测试特征初始集由多个医学图像测试初始特征组成;所述医学图像测试初始特征是所述训练好的卷积神经网络特征提取网络中的卷积层输出的特征;

融合降维模块,用于对所述测试特征初始集进行对齐融合和特征降维,得到测试特征集;所述测试特征集由多个尺寸相同的医学图像测试特征组成;

抽样模块,用于采用自助抽样法依次对所述医学图像测试集和所述测试特征集进行随机抽样,得到多个测试样本子集;

初始分类模块,用于将所述测试样本子集输入至对应的训练好的极限学习机模型中,得到测试集初始分类结果;一个所述测试样本子集对应一个所述训练好的极限学习机模型;一个所述训练好的极限学习机模型对应一个所述测试集初始分类结果;

分类结果确定模块,用于将多个所述测试集初始分类结果输入至训练好的随机森林模型中,得到医学图像测试集分类结果。

可选的,所述基于机器学习的医学图像分类系统还包括:第一训练模块,用于确定所述训练好的卷积神经网络特征提取网络;所述第一训练模块,具体包括:

第一训练集获取单元,用于获取医学图像训练集;所述医学图像训练集由多个医学图像训练样本和对应的类标签组成;

神经网络模型构建单元,用于构建卷积神经网络模型;所述卷积神经网络模型包括待定参数的输入层、待定参数的输出层、待定参数的全连接层、多个待定参数的卷积层和多个待定参数的池化层;

第一训练单元,用于将所述医学图像训练集输入至所述卷积神经网络模型中,确定每个层的待定参数,得到训练好的卷积神经网络模型;

特征提取网络确定单元,用于去除所述训练好的卷积神经网络模型中的全连接层,得到训练好的卷积神经网络特征提取网络。

可选的,所述基于机器学习的医学图像分类系统还包括:第二训练模块,用于确定所述训练好的极限学习机模型;所述第二训练模块,具体包括:

第二训练集获取单元,用于获取医学图像训练集;所述医学图像训练集由多个医学图像训练样本和对应的类标签组成;

第一训练特征提取单元,用于将多个所述医学图像训练样本输入至训练好的卷积神经网络特征提取网络中,得到训练特征初始集;所述训练特征初始集由多个医学图像训练初始特征组成;所述医学图像训练初始特征是所述训练好的卷积神经网络特征提取网络中的卷积层输出的特征;

第一训练特征集确定单元,用于对所述训练特征初始集进行对齐融合和特征降维,得到训练特征集;所述训练特征集由多个尺寸相同的医学图像训练特征组成;

第一训练样本子集确定单元,用于采用自助抽样法依次对所述医学图像训练集和所述训练特征集进行随机抽样,得到多个训练样本子集;

极限学习机模型构建单元,用于构建参量待定的极限学习机模型;

第二训练单元,用于将每个所述训练样本子集分别输入至所述参量待定的极限学习机模型中,得到多个训练好的极限学习机模型。

可选的,所述基于机器学习的医学图像分类系统还包括:第三训练模块,用于确定所述训练好的随机森林模型;所述第三训练模块,具体包括:

第三训练集获取单元,用于获取医学图像训练集;所述医学图像训练集由多个医学图像训练样本和对应的类标签组成;

第二训练特征提取单元,用于将多个所述医学图像训练样本输入至训练好的卷积神经网络特征提取网络中,得到训练特征初始集;所述训练特征初始集由多个医学图像训练初始特征组成;所述医学图像训练初始特征是所述训练好的卷积神经网络特征提取网络中的卷积层输出的特征;

第二训练特征集确定单元,用于对所述训练特征初始集进行对齐融合和特征降维,得到训练特征集;所述训练特征集由多个尺寸相同的医学图像训练特征组成;

第二训练样本子集确定单元,用于采用自助抽样法依次对所述医学图像训练集和所述训练特征集进行随机抽样,得到多个训练样本子集;

训练集初始分类结果确定单元,用于将所述训练样本子集输入至对应的训练好的极限学习机模型中,得到训练集初始分类结果;一个所述训练样本子集对应一个所述训练好的极限学习机模型;一个所述训练好的极限学习机模型对应一个所述训练集初始分类结果;

随机森林模型构建单元,用于构建参量待定的随机森林模型;

第三训练单元,用于将多个所述训练集初始分类结果作为所述参量待定的随机森林模型的输入,将对应训练样本子集中类标签作为所述参量待定的随机森林模型的输出,对所述参量待定的随机森林模型进行训练,得到训练好的随机森林模型。

可选的,所述融合降维模块,具体包括:

对齐融合单元,用于采用最近邻差值法对所述测试特征初始集进行对齐融合,得到测试融合特征集;所述测试融合特征集内的特征的尺寸均相等;

降维单元,用于采用主成分分析法对所述测试融合特征集进行特征降维,得到测试特征集。

与现有技术相比,本发明的有益效果是:

本发明提出了一种基于机器学习的医学图像分类方法及系统,通过训练好的卷积神经网络特征提取网络进行特征信息自动提取,并对测试特征初始集进行对齐融合和特征降维,融合不同层的特性信息,提高了特性信息的准确性和全面性,降低了计算的复杂度,提高了分类效率;通过采用自助抽样法依次对医学图像测试集和测试特征集进行随机抽样,生成多个不同的测试样本子集,提高了小样本集测试数据的多样性和有效性;通过随机森林算法对多个极限学习机模型的测试集初始分类结果进行集成,分类模型的泛化能力高,分类的准确度高。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例1一种基于机器学习的医学图像分类方法的流程图;

图2为本发明实施例2训练过程的示意图;

图3为本发明实施例3一种基于机器学习的医学图像分类系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例1

图1为本发明实施例1一种基于机器学习的医学图像分类方法的流程图。

参见图1,本实施例的基于机器学习的医学图像分类方法,包括:

步骤s1:获取医学图像测试集;所述医学图像测试集由多个医学图像测试样本组成。

步骤s2:将所述医学图像测试集输入至训练好的卷积神经网络特征提取网络中,得到测试特征初始集。

所述训练好的卷积神经网络特征提取网络包括输入层、输出层、多个卷积层和多个池化层;所述测试特征初始集由多个医学图像测试初始特征组成;所述医学图像测试初始特征是所述训练好的卷积神经网络特征提取网络中的卷积层输出的特征。

该步骤中,所述训练好的卷积神经网络特征提取网络的确定方法为:

获取医学图像训练集;所述医学图像训练集由多个医学图像训练样本和对应的类标签组成。

构建卷积神经网络模型;所述卷积神经网络模型包括待定参数的输入层、待定参数的输出层、待定参数的全连接层、多个待定参数的卷积层和多个待定参数的池化层。

将所述医学图像训练集输入至所述卷积神经网络模型中,确定每个层的待定参数,得到训练好的卷积神经网络模型。

去除所述训练好的卷积神经网络模型中的全连接层,得到训练好的卷积神经网络特征提取网络。

本实施例中,所述训练好的卷积神经网络特征提取网络依次由输入层、第1层卷积层、第1层池化层、第2层卷积层、第2层池化层、......、第a层卷积层、第a层池化层和输出层组成,所述医学图像测试初始特征是所述训练好的卷积神经网络特征提取网络中的第a-l层卷积层到第a层卷积层输出的特征,这些医学图像测试初始特征形成包含不同尺度的测试特征初始集,其中,a≥1,0≤l≤a-1。

步骤s3:对所述测试特征初始集进行对齐融合和特征降维,得到测试特征集;所述测试特征集由多个尺寸相同的医学图像测试特征组成。

所述步骤s3,具体包括:

采用最近邻差值法对所述测试特征初始集进行对齐融合,将低尺寸的特性信息扩展到高尺寸,得到测试融合特征集;所述测试融合特征集内的特征的尺寸均相等。

采用主成分分析法对所述测试融合特征集进行特征降维,降低特征信息冗余,得到测试特征集。

步骤s4:采用自助抽样法依次对所述医学图像测试集和所述测试特征集进行随机抽样,得到多个测试样本子集。

该步骤中,采用自助抽样法依次对所述医学图像测试集和所述测试特征集进行有放回地随机抽样,多个测试样本子集的维度相同。

步骤s5:将所述测试样本子集输入至对应的训练好的极限学习机模型中,得到测试集初始分类结果。

一个所述测试样本子集对应一个所述训练好的极限学习机模型;一个所述训练好的极限学习机模型对应一个所述测试集初始分类结果。

该步骤中,所述训练好的极限学习机模型的确定方法为:

获取医学图像训练集;所述医学图像训练集由多个医学图像训练样本和对应的类标签组成。

将多个所述医学图像训练样本输入至训练好的卷积神经网络特征提取网络中,得到训练特征初始集;所述训练特征初始集由多个医学图像训练初始特征组成;所述医学图像训练初始特征是所述训练好的卷积神经网络特征提取网络中的卷积层输出的特征。

对所述训练特征初始集进行对齐融合和特征降维,得到训练特征集;所述训练特征集由多个尺寸相同的医学图像训练特征组成。

采用自助抽样法依次对所述医学图像训练集和所述训练特征集进行随机抽样,得到多个训练样本子集。

构建参量待定的极限学习机模型。

将每个所述训练样本子集分别输入至所述参量待定的极限学习机模型中,得到多个训练好的极限学习机模型。

步骤s6:将多个所述测试集初始分类结果输入至训练好的随机森林模型中,得到医学图像测试集分类结果。

该步骤中,所述训练好的随机森林模型的确定方法为:

获取医学图像训练集;所述医学图像训练集由多个医学图像训练样本和对应的类标签组成。

将多个所述医学图像训练样本输入至训练好的卷积神经网络特征提取网络中,得到训练特征初始集;所述训练特征初始集由多个医学图像训练初始特征组成;所述医学图像训练初始特征是所述训练好的卷积神经网络特征提取网络中的卷积层输出的特征。

对所述训练特征初始集进行对齐融合和特征降维,得到训练特征集;所述训练特征集由多个尺寸相同的医学图像训练特征组成。

采用自助抽样法依次对所述医学图像训练集和所述训练特征集进行随机抽样,得到多个训练样本子集。

将所述训练样本子集输入至对应的训练好的极限学习机模型中,得到训练集初始分类结果;一个所述训练样本子集对应一个所述训练好的极限学习机模型;一个所述训练好的极限学习机模型对应一个所述训练集初始分类结果。

构建参量待定的随机森林模型。

将多个所述训练集初始分类结果作为所述参量待定的随机森林模型的输入,将对应训练样本子集中类标签作为所述参量待定的随机森林模型的输出,对所述参量待定的随机森林模型进行训练,得到训练好的随机森林模型。

作为一种可选的实施方式,随机森林模型的基学习器采用cart分类树。

下面提供了了一个更为具体的实施方式。

实施例2

本实施例基于机器学习的医学图像分类方法包括训练过程和测试过程。

1)训练过程

参见图2,训练过程包括如下步骤:

步骤1:设计七层的卷积神经网络(cnn)分类网络,从输入层到输出层依次为卷积层、池化层、卷积层、池化层、卷积层、池化层、全连接层,采用训练数据集对该cnn分类网络进行训练。

步骤2:将步骤1训练得到的cnn网络的最后一层分类层去掉,得到基于cnn的特征信息提取网络,该网络具有多个卷积层和多个池化层。

步骤3:利用步骤2得到的特征信息提取网络对所有训练数据进行处理,并将该网络的最后3层卷积层(第a-2层卷积层、第a-2层卷积层、第a层卷积层)的输出结果作为特征信息,得到不同尺寸大小的特征信息。

步骤4:对步骤3得到的特征信息进行特征对齐融合,生成尺寸相同的特征信息。

步骤5:采用主成分分析(pca)算法对步骤4产生的特征信息进行去冗余、降维,提取出主要的特征信息,得到特征信息向量集f,该特征向量集维度为k×p,其中k为样本数量,p为特征信息数量。

步骤6:采用自助(bootstrap)抽样算法先对训练样本进行有放回地随机抽样,得到n(n<k)个样本;然后再对特征信息进行有放回地随机抽样,得到n个特征信息,每个样本包含n(n<p)个特征信息,得到的训练样本子集表示为(xj,tj),j=1,2,...n,tj为目标参考值(类标签),其中:

xj=[xj1,xj2,...,xjn]t∈rn

tj=[tj1,tj2,...,tjm]t∈rm

步骤7:以步骤6得到的数据(xj,tj)为训练数据,对极限学习机(elm)模型进行训练,得出训练好的elm模型。

步骤8:重复步骤6~7,直至生成m个训练好的elm模型。

步骤9:通过步骤8得到的m个训练好的elm模型,生成m个输出结果。

步骤10:将步骤9得到的m个结果传输给随机森林模型,并以样本的目标值(类标签)作为参考,训练随机森林模型,得到训练好的随机森林模型。

步骤11:整合步骤1~10得到的模型,生成本实施例的高精度分类模型。

2)测试过程:

将获取医学图像测试集直接将输入到上述训练好的模型中,即可得到预测分类结果。

作为一种可选的实施方式,步骤7的具体方法为:

首先,计算具有l个隐藏节点的elm输出:

其中,f(x)为激活函数,wi=[wi,1,wi,2,…,wi,n]t为输入权重向量,βi为输出权重,bi为第i个隐藏层单元的偏置。

然后,通过最小化损失函数

求解输出权重β:

其中,为h的伪逆矩阵,其中h为:

随机选定w1和b1值,通过求解矩阵h得到β,进而得出训练好的elm模型。

本实施例提供的基于机器学习的医学图像分类方法,采用cnn对数据进行特征信息自动提取,保证提取信息的准确全面,并采用elm对数据进行分类,提高模型的训练速度,同时为保证模型的精度和泛化能力,采用随机森林算法对多个不同的elm模型输出结果进行组合,避免模型的过拟合,提高了模型的泛化能力。该方法能够在提高分类效率的同时,提高分类的准确度。

实施例3

本实施例提供了一种基于机器学习的医学图像分类系统,图3为本发明实施例3一种基于机器学习的医学图像分类系统的结构示意图。

参见图3,实施例的基于机器学习的医学图像分类系统包括:

测试集获取模块301,用于获取医学图像测试集;所述医学图像测试集由多个医学图像测试样本组成。

初始特征提取模块302,用于将所述医学图像测试集输入至训练好的卷积神经网络特征提取网络中,得到测试特征初始集;所述训练好的卷积神经网络特征提取网络包括输入层、输出层、多个卷积层和多个池化层;所述测试特征初始集由多个医学图像测试初始特征组成;所述医学图像测试初始特征是所述训练好的卷积神经网络特征提取网络中的卷积层输出的特征。

融合降维模块303,用于对所述测试特征初始集进行对齐融合和特征降维,得到测试特征集;所述测试特征集由多个尺寸相同的医学图像测试特征组成。

抽样模块304,用于采用自助抽样法依次对所述医学图像测试集和所述测试特征集进行随机抽样,得到多个测试样本子集。

初始分类模块305,用于将所述测试样本子集输入至对应的训练好的极限学习机模型中,得到测试集初始分类结果;一个所述测试样本子集对应一个所述训练好的极限学习机模型;一个所述训练好的极限学习机模型对应一个所述测试集初始分类结果。

分类结果确定模块306,用于将多个所述测试集初始分类结果输入至训练好的随机森林模型中,得到医学图像测试集分类结果。

作为一种可选的实施方式,所述初始特征提取模块302中,所述训练好的卷积神经网络特征提取网络依次由输入层、第1层卷积层、第1层池化层、第2层卷积层、第2层池化层、......、第a层卷积层、第a层池化层和输出层组成,所述医学图像测试初始特征是所述训练好的卷积神经网络特征提取网络中的第a-l层卷积层到第a层卷积层输出的特征,这些医学图像测试初始特征形成包含不同尺度的测试特征初始集,其中,a≥1,0≤l≤a-1。

作为一种可选的实施方式,所述基于机器学习的医学图像分类系统还包括:第一训练模块,用于确定所述训练好的卷积神经网络特征提取网络;所述第一训练模块,具体包括:

第一训练集获取单元,用于获取医学图像训练集;所述医学图像训练集由多个医学图像训练样本和对应的类标签组成。

神经网络模型构建单元,用于构建卷积神经网络模型;所述卷积神经网络模型包括待定参数的输入层、待定参数的输出层、待定参数的全连接层、多个待定参数的卷积层和多个待定参数的池化层。

第一训练单元,用于将所述医学图像训练集输入至所述卷积神经网络模型中,确定每个层的待定参数,得到训练好的卷积神经网络模型。

特征提取网络确定单元,用于去除所述训练好的卷积神经网络模型中的全连接层,得到训练好的卷积神经网络特征提取网络。

作为一种可选的实施方式,所述基于机器学习的医学图像分类系统还包括:第二训练模块,用于确定所述训练好的极限学习机模型;所述第二训练模块,具体包括:

第二训练集获取单元,用于获取医学图像训练集;所述医学图像训练集由多个医学图像训练样本和对应的类标签组成。

第一训练特征提取单元,用于将多个所述医学图像训练样本输入至训练好的卷积神经网络特征提取网络中,得到训练特征初始集;所述训练特征初始集由多个医学图像训练初始特征组成;所述医学图像训练初始特征是所述训练好的卷积神经网络特征提取网络中的卷积层输出的特征。

第一训练特征集确定单元,用于对所述训练特征初始集进行对齐融合和特征降维,得到训练特征集;所述训练特征集由多个尺寸相同的医学图像训练特征组成。

第一训练样本子集确定单元,用于采用自助抽样法依次对所述医学图像训练集和所述训练特征集进行随机抽样,得到多个训练样本子集。

极限学习机模型构建单元,用于构建参量待定的极限学习机模型。

第二训练单元,用于将每个所述训练样本子集分别输入至所述参量待定的极限学习机模型中,得到多个训练好的极限学习机模型。

作为一种可选的实施方式,所述基于机器学习的医学图像分类系统还包括:第三训练模块,用于确定所述训练好的随机森林模型;所述第三训练模块,具体包括:

第三训练集获取单元,用于获取医学图像训练集;所述医学图像训练集由多个医学图像训练样本和对应的类标签组成。

第二训练特征提取单元,用于将多个所述医学图像训练样本输入至训练好的卷积神经网络特征提取网络中,得到训练特征初始集;所述训练特征初始集由多个医学图像训练初始特征组成;所述医学图像训练初始特征是所述训练好的卷积神经网络特征提取网络中的卷积层输出的特征。

第二训练特征集确定单元,用于对所述训练特征初始集进行对齐融合和特征降维,得到训练特征集;所述训练特征集由多个尺寸相同的医学图像训练特征组成。

第二训练样本子集确定单元,用于采用自助抽样法依次对所述医学图像训练集和所述训练特征集进行随机抽样,得到多个训练样本子集。

训练集初始分类结果确定单元,用于将所述训练样本子集输入至对应的训练好的极限学习机模型中,得到训练集初始分类结果;一个所述训练样本子集对应一个所述训练好的极限学习机模型;一个所述训练好的极限学习机模型对应一个所述训练集初始分类结果。

随机森林模型构建单元,用于构建参量待定的随机森林模型。

第三训练单元,用于将多个所述训练集初始分类结果作为所述参量待定的随机森林模型的输入,将对应训练样本子集中类标签作为所述参量待定的随机森林模型的输出,对所述参量待定的随机森林模型进行训练,得到训练好的随机森林模型。

作为一种可选的实施方式,所述融合降维模块,具体包括:

对齐融合单元,用于采用最近邻差值法对所述测试特征初始集进行对齐融合,得到测试融合特征集;所述测试融合特征集内的特征的尺寸均相等。

降维单元,用于采用主成分分析法对所述测试融合特征集进行特征降维,得到测试特征集。

本实施例的基于机器学习的医学图像分类系统,能够保证提取信息的准确全面;能够提高模型的训练速度,同时保证模型的精度和泛化能力;能够避免模型的过拟合,提高了模型的泛化能力。该系统能够在提高分类效率的同时,提高分类的准确度。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1