图像分割模型训练方法和装置与流程

文档序号:21046940发布日期:2020-06-09 20:58阅读:239来源:国知局
图像分割模型训练方法和装置与流程

本公开涉及计算机技术领域,尤其涉及一种图像分割模型训练方法、装置、电子设备以及存储介质。



背景技术:

相关技术中,基于机器学习技术进行语义分割等任务中,会通过大量数据训练模型来实现,在模型训练时,会通过损失函数来评估模型的预测结果和真实结果的不一致程度,以便对模型进行修正,提高模型的精准度。

但是,发明人发现,当机器学习技术用于模型训练时,若各语义在图像的面积占比不一致,特别是不同语义在图像中各自所占面积相差较大时,训练得到的模型精准度较低。



技术实现要素:

本公开提供一种图像分割模型训练方法、装置、电子设备以及存储介质,以至少解决相关技术中训练得到的模型精准度较低的问题。本公开的技术方案如下:

根据本公开实施例的第一方面,提供一种图像分割模型训练方法,包括:

获取图像样本数据集合;所述图像样本数据集合包括被标注为正样本类别的图像样本数据,以及,被标注为负样本类别的图像样本数据;

将获取的所述图像样本数据集合输入到待训练的图像分割模型中,得到所述待训练的图像分割模型输出的各类别的预测概率;

根据所述图像样本数据集合中不同样本类别的图像样本数据的数量,确定预设损失函数包含的权重系数;其中,所述权重系数,包括所述预设损失函数的第一评估部分的第一权重系数和第二评估部分的第二权重系数中的至少一个;所述第一评估部分用于确定标注类别的预测概率相对于1的损失值;所述第二评估部分用于确定非标注类别的预测概率相对于0的损失值;

根据所述预设损失函数、确定出的所述权重系数和所述预测概率,确定损失值;

根据所述损失值调整所述待训练的图像分割模型的模型参数,直至调整所述模型参数后得到的图像分割模型的符合预设标准时,将符合预设标准的图像分割模型作为训练好的图像分割模型。

在一种可选的实施方式中,所述的图像分割模型训练方法,包括:

所述第一权重系数和所述第二权重系数,用于在正样本类别的图像样本数据的数量多于负样本类别的图像样本数据的数量时,降低第一评估部分得到的损失值的权重,或提高第二评估部分得到的损失值的权重;

或,所述第一权重系数和所述第二权重系数,用于在负样本类别的图像样本数据的数量多于正样本类别的图像样本数据的数量时,提高第一评估部分得到的损失值的权重,或降低第二评估部分得到的损失值的权重。

在一种可选的实施方式中,所述的图像分割模型训练方法,包括:

所述第一权重系数包含负样本类别的图像样本数据的数量与正样本类别的图像样本数据的数量的比值;

所述第二权重系数包含正样本类别的图像样本数据的数量与负样本类别的图像样本数据的数量的比值。

在一种可选的实施方式中,所述第一权重系数为:

α1=(ni/nj)0.5

所述第二权重系数为:

α2=(nj/ni)0.5

其中,ni为负样本类别的图像样本数据的数量,nj为正样本类别的图像样本数据的数量。

在一种可选的实施方式中,所述预设损失函数的表达式为:

l=-α1×label×log(predict)-(1-label)×log(1-predict);

l=-label×log(predict)-α2×(1-label)×log(1-predict);

l=-α1×label×log(predict)-α2×(1-label)×log(1-predict);

其中,label为人工标注的训练样本的标注类别,predict为所述图像分割模型输出的预测类别。

在一种可选的实施方式中,所述正样本类别的图像样本数据的为图像中的头发部分的像素,所述负样本类别的图像样本数据的为图像中非头发部分的像素。

根据本公开实施例的第二方面,提供一种图像分割方法,包括:

获取待分割的包含目标物体的图像;

将所述包含目标物体的图像输入到所述训练好的图像分割模型中,以得到分割出的目标物体。

根据本公开实施例的第三方面,提供一种图像分割模型训练装置,包括:

获取单元,被配置为执行获取图像样本数据集合;

预测概率确定单元,被配置为执行将获取的所述图像样本数据集合输入到待训练的图像分割模型中,得到所述待训练的图像分割模型输出的各类别的预测概率;

权值系数确定单元,被配置为执行根据所述图像样本数据集合中不同样本类别的图像样本数据的数量,确定预设损失函数包含的权重系数;其中,所述权重系数,包括所述预设损失函数的第一评估部分的第一权重系数和第二评估部分的第二权重系数中的至少一个;所述第一评估部分用于确定标注类别的预测概率相对于1的损失值;所述第二评估部分用于确定非标注类别的预测概率相对于0的损失值;

损失值确定单元,被配置为执行根据所述预设损失函数、确定出的所述权重系数和所述预测概率,确定损失值;

调整单元,被配置为执行根据所述损失值调整所述待训练的图像分割模型的模型参数,直至调整所述模型参数后得到的图像分割模型的符合预设标准时,将符合预设标准的图像分割模型作为训练好的图像分割模型。

根据本公开实施例的第四方面,提供一种图像分割装置,包括:

图像获取模块,被配置为执行获取待分割的包含目标物体的图像;

分割模块,被配置为执行将所述包含目标物体的图像输入到所述训练好的图像分割模型中,以得到分割出的目标物体。

根据本公开实施例的第五方面,提供一种电子设备,包括:

处理器;用于存储所述处理器可执行指令的存储器;

其中,所述处理器被配置为执行上述第一方面中任一项图像分割模型训练方法步骤。

根据本公开实施例的第六方面,提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述第一方面中任一项图像分割模型训练方法。

根据本公开实施例的第七方面,提供一种计算机程序产品,当其在电子设备上运行时,使得图像分割模型训练电子设备执行:上述第一方面中任一项图像分割模型训练方法的方法步骤。

本公开的实施例提供的技术方案至少带来以下有益效果:

在进行图像分割模型的训练时,将获取到的图像样本数据输入到待训练的图像分割模型中,得到所述图像分割模型输出的各类别的预测概率,根据图像样本数据的数量,确定预设损失函数的权重系数,根据预设损失函数、确定出的权重系数和预测概率,确定损失值,根据损失值调整所述图像分割模型的模型参数,在该过程中,预设损失函数包括第一评估部分和第二评估部分,第一评估部分确定标注类别的预测概率相对于1的损失值;第二评估部分确定非标注类别的预测概率相对于0的损失值。通过第一评估部分和第二评估部分,可以分别根据标注类别的预测概率相对于1的损失值,以及非标注类别的预测概率相对于0的损失值,这样得到的损失值能够准确反映预测概率相对于期望概率的差距,能够提高训练的模型数据分类的精准度。

另外,所述第一评估部分包括第一权重系数,和/或,所述第二评估部分包括第二权重系数,且第一权重系数和第二权重系数,可以是根据不同样本类别的图像样本数据的数量确定出的,以能够在正样本类别的图像样本数据的数量与负样本类别的图像样本数据的数量不同时,平衡第一评估部分和第二评估部分得到的损失值的权重。这样,即使样本中正负样本数量不平衡,相对于不添加权重系数而言,也可以缩小第一评估部分和第二评估部分得到的损失值的差距,进而提升模型数据分类的精准度。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种图像分割模型训练方法的流程图。

图2是根据一示例性实施例示出的一种图像分割方法的流程图。

图3是根据一示例性实施例示出的一种图像分割模型训练装置的框图。

图4是根据一示例性实施例示出的一种图像分割装置的框图。

图5是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本文中提供的技术方案应用于机器学习技术领域,机器学习技术可通过训练模型来实现机器的智能化,广泛应用于目标识别、分类、聚类等实际场景中。机器学习可利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果。机器学习是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。机器学习通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

本说明书一个或多个实施例中得到的模型可用于图像分割,例如,通过对图像中像素的分类,可识别图像中目标类别的像素点,基于识别出的目标类别进而实现将目标物体分割出来的功能。作为示例,在图像处理领域,在对图像中的头发进行识别时,即可通过图像分割模型对图像中的像素点进行分类,得到属于头发类别的像素点,即分割出了图像中的头发。

本说明书一个或多个实施例中,在进行图像分割模型训练时,会通过损失函数来评估模型的预测结果和真实结果的不一致程度,然后根据不一致程度对图像分割模型的参数进行修正,以提高模型在进行图像分割时的精准度。在进行图形分割模型训练时,会通过训练样本对图像分割模型进行训练,训练样本中包括正样本类别的图像样本数据和负样本类别的图像样本数据,其中正样本类别的图像样本数据可以是图像中目标类别的像素点,负样本类别的图像样本数据可以是图像中除目标类别的像素点。将正样本类别的图像样本数据和负样本类别的图像样本数据输入到图像分割模型中,会得到图像分割模型输出的预测类别,然后再根据损失函数得到的损失值调整图像分割模型的模型参数,从而得到训练好的图像分割模型。

图1是根据一示例性实施例示出的一种图像分割模型训练方法的流程图,通过该方法可以提升图像分割的精准度,该方法的执行主体包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备。其中,所述服务器可以是单个网络服务器或者多个网络服务器组成的服务器组或基于云计算(cloudcomputing)的由大量计算机或网络服务器构成的云。如图1所示,该方法包括以下步骤。

在步骤11中,将获取的图像样本数据集合输入到待训练的图像分割模型中,得到图像分割模型输出的各类别的预测概率。

本说明书一个或多个实施例中,图像分割模型可以是神经网络、深度神经网络或循环神经网络(recurrentneuralnetworks,rnn)等。

在一种实施方式中,在执行步骤11前,可以包括获取图像样本数据集合。

图像样本数据集合包括被标注为正样本类别的图像样本数据,以及,被标注为负样本类别的图像样本数据,图像样本数据包含待分类的图像的特征,这里图像的特征可以是图像的像素,或者还可以是像素的颜色值等。在实际应用中,这里的正样本类别的图像样本数据可以是图像中目标物体的像素,负样本类别的图像样本数据可以是图像中除目标物体的以外像素。另外,图像样本数据集合中还可以包含人工标注的图像样本数据的标注类别,即,目标物体可以是人工标注的标注类别。

可选的,获取图像样本数据时,例如,可以是通过方向梯度直方图(histogramoforientedgradient,hog)的方式进行获取。

在将图像样本数据输入到待训练的图像分割模型中时,待训练的图像分割模型会根据样本数据中待分类的图像样本数据包含的图像的特征,对图像样本数据进行分类得到各类别的预测概率。

以二分类为例,类别个数为2,包含类别a和类别b,对于人工标注类别为a的样本a而言,期望输出可表达为pa=(1,0),模型的实际输出可能为qa=(0.8,0.2),即样本a的预测结果为:类别a的预测概率为0.8,类别b的预测概率为0.2。

在步骤12中,根据图像样本数据集合中不同样本类别的图像样本数据的数量,确定预设损失函数包含的权重系数。

这里的预设损失函数可以包括2部分,这里为便于表述,将这2部分称为第一评估部分和第二评估部分。

第一评估部分,可以确定标注类别的预测概率相对于1的损失值,由于标注类别的期望概率为1,那么,图像分割模型预测的标注类别的概率越接近于1,则损失值越小,说明模型越好。

第二评估部分,可以确定非标注类别的预测概率相对于0的损失值,由于非标注类别的期望概率为0,那么,图像分割模型预测的非标注类别的概率越接近于0,则损失值越小,说明模型越好。

通过第一评估部分和第二评估部分,可以分别根据标注类别的预测概率相对于1的损失值,以及非标注类别的预测概率相对于0的损失值,这样得到的损失值能够准确反映预测概率相对于期望概率的差距,能够提高训练的图像分割模型数据分类的精准度。

当训练图像分割模型所使用的图像样本数据集合中正样本类别的图像样本数据的数量和负样本类别的图像样本数据的数量不同时,发明人发现,对于未知类别的图像数据,模型更倾向于将其分类为图像样本数据中标注类别多的类别。例如,正样本类别的图像样本数据较少,负样本类别的图像样本数据较多,训练得到的模型更倾向于将未知类别的图像数据分类为至负样本所属类别,尤其对于特征介于二者之间的样本。

举例来说,基于深度学习对图像中的头发进行分割时,由于在图像中头发区域的面积往往小于非头发区域面积,所以头发边缘区域会被模型误判为非头发区域。

因此,为了进一步提升图像分割模型分割出目标物体的精准度,本说明书的一个实施例中,提出如下改进:

在第一评估部分乘以第一权重系数,和/或,在第二评估部分乘以第二权重系数。

在本说明书一个或多个实施例中,第一权重系数和第二权重系数可以根据图像样本数据集合中不同样本类别的图像样本数据的数量确定,具体包括:

第一权重系数可以包含负样本类别的图像样本数据的数量与正样本类别的图像样本数据的数量的比值。这样当负样本类别的图像样本数据的数量多于正样本类别的图像样本数据的数量时,可以提高第一评估部分得到的损失值的权重,也即降低了第二评估部分得到的损失值的权重。

第二权重系数可以包含正样本类别的图像样本数据的数量与负样本类别的图像样本数据的数量的比值。这样当正样本类别的图像样本数据的数量多于负样本类别的图像样本数据的数量时,可以降低第一评估部分得到的损失值的权重,也即提高了第二评估部分得到的损失值的权重。

本说明书一个或多个实施例中,第一权重系数可以表示为:

α1=(ni/nj)0.5

第二权重系数可以表示为:

α2=(nj/ni)0.5

其中,ni为负样本类别的图像样本数据的数量,nj为正样本类别的图像样本数据的数量,j和i用于区分表达式中的两个n值。

上面α1和α2的表达式中的“0.5”,可以平滑权重系数的权重调节力度,使得在正样本类别的图像样本数据的数量与负样本类别的图像样本数据的数量的差距非常大时,其权重调节力度不至于过大,以免调节力度过大影响模型的准确性。

需要特别说明的是,在本说明书一个或多个实施例中,预设损失函数的权重系数可以具体包括第一评估部分的第一权重系数和第二评估部分的第二权重系数中的至少一个。即,可以只有第一权重系数,也可以只有第二权重系数,也可以第一权重系数和第二权重系数都有。

在实际应用中,第一权重系数和第二权重系数,在正样本类别的图像样本数据的数量与负样本类别的图像样本数据的数量不同时,可以平衡第一评估部分和第二评估部分得到的损失值的权重。这样,在图像样本数据中正负样本的数量不平衡时,相对于不添加权重系数的损失函数而言,可以缩小第一评估部分和第二评估部分得到的损失值的差距,进而提升模型数据分类的精准度。

当然,在具体实施时,可以给第一评估部分乘以第一权重系数,而不再给第二评估部分乘以第二权重系数;或者,给第二评估部分乘以第二权重系数,而不再给第一评估部分乘以第一权重系数;或者,给第一评估部分乘以第一权重系数,也给第二评估部分乘以第二权重系数。

采用以上三种对预设损失函数添加权重系数的方式中的任意一种,相对于不添加权重系数的损失函数而言,都可以缩小第一评估部分和第二评估部分得到的损失值的差距,进而提升模型数据分类的精准度。

在步骤13中,根据预设损失函数、确定出的权重系数和预测概率,确定损失值。

这里的权重系数可以是通过步骤12确定出来的。这里的预测概率可以是通过步骤11输出的各类别的预测概率。

在实际应用中,通过已确定权重系数的预设损失函数,根据图像样本数据对应的标注类别,以及模型输出的各类别的预测概率,可以确定出图像分割模型对各类别的预测概率的损失值,即,确定出预测概率相对于期望概率的差距。

在图像分割模型训练的过程中,可以根据确定出的损失值调整模型参数,以得到训练好的图像分割模型。

在步骤14中,根据损失值调整待训练的图像分割模型的模型参数,直至调整模型参数后得到的图像分割模型的符合预设标准时,将符合预设标准的图像分割模型作为训练好的图像分割模型。

通过图像样本数据集合,根据通过步骤13确定出的损失值,反复调整图像分割模型的模型参数,在图像分割模型符合预设标准后,即可获得训练好的图像分割模型,即,将符合预设标准的图像分割模型作为训练好的图像分割模型。其中,所述预设标准可以是图像分割模型的训练结果的召回率、精准率等达到预设值。在得到训练好的图像分割模型后,可以将其用于线上对图像中目标物体的分割,例如用于分割出图像中头发区域。

通过上述步骤训练得到的图像分割模型,可提升图像分割模型分割出图像中的目标物体的准确度,尤其在正样本类别的图像样本数据的数量和负样本类别的图像样本数据的数量不平衡时,可提升图像分割模型分割出图像中目标物体的精准度,例如,在进行头发分割时,可提升头发边缘的分割效果,特别是对头发区域占比较小的图像的分割效果,进而准确识别出图像中的头发区域。

在本说明书一个或多个实施例中,预设损失函数的表达式可以为:

l=-α1×label×log(predict)-(1-label)×log(1-predict);

l=-label×log(predict)-α2×(1-label)×log(1-predict);

l=-α1×label×log(predict)-α2×(1-label)×log(1-predict);

其中,label为人工标注的训练样本的标注类别,predict为所述图像分割模型输出的预测类别。

在本说明书一个或多个实施例中,第一评估部分的表达式可以为-label×log(predict),或者-α1×label×log(predict);第二评估部分的表达式可以为(1-label)×log(1-predict),或者α2×(1-label)×log(1-predict)。

下面以图像分割模型为用于对图像中的头发进行分割的头发分割模型为例,进一步阐述本说明书提供的图像分割模型训练方法。

首先,标注一批训练图像中的头发区域。

然后,根据训练图像和标注的头发区域,训练头发分割模型,其中,训练过程中所使用的损失函数为前文所述的预设损失函数。

在头发分割模型训练完毕后,可以用于分割出图像中的头发区域。

本说明书一个或多个实施例中,在分割出头发区域后,可以更换头发的颜色,实现对头发进行染发的功能,使头发的颜色多样化,提高产品趣味性,提升用户体验。

本说明书一个或多个实施例中,在分割出头发区域后,可以将头发的形状与预设发型的形状进行对比,以判断头发的发型。

通过本公开中的第一权重系数和第二权重系数,可以根据头发区域面积和背景区域面积的比例,自适应调整正负样本比例对结果的影响。例如当图像中头发面积较小时,如果损失函数不添加权重系数,容易导致头发边缘被识别成背景区域。而在损失函数添加第一权重系数和/或第二权重系数后,受权重的调整,头发识别效果将得到极大改善。

图2是根据一示例性实施例示出的一种基于图像分割模型的图像分割方法的流程图,通过该方法可以提升图像分割的准确度,该方法的执行主体包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备。其中,所述服务器可以是单个网络服务器或者多个网络服务器组成的服务器组或基于云计算(cloudcomputing)的由大量计算机或网络服务器构成的云。如图2所示,该方法可以包括以下步骤:

步骤21:获取待分割的包含目标物体的图像;

步骤22:将包含目标物体的图像输入到训练好的图像分割模型中,得到分割出的目标物体。

可选地,训练好的图像分割模型可以但不限于采用上述图1示出的图像分割模型的训练方法训练得到。其中,针对图像分割模型的训练方法的相关描述可参照图1示出的内容,为避免赘述,此处不再说明。

其中,图像分割模型中的损失函数可以采用前文针对图1的文字说明中所述的预设损失函数,基于采用上述本公开实施例中的预设损失函数的图像分割模型,可以在目标物体在图像中的区域占比较小时,提升图像分割模型分割出图像中目标物体的精确度。

下面以基于图像分割模型对图像中的头发进行分割的方法,进一步阐述本说明书提供的图像分割方法在实际当中的应用。

首先,获取包含头发的图像。

然后,将包含头发的图像输入到图像分割模型中,得到分割出的头发区域。

在实际应用中,分割出头发区域后,可以更换头发的颜色,实现对头发进行染发的功能,使头发的颜色多样化,提高产品趣味性,提升用户体验。或者还可以在分割出头发区域后,可以将头发的形状与预设发型的形状进行对比,以判断头发的发型。

采用本公开实施例中图像分割方法,可以准确分割出图像中目标物体,尤其在图像中目标物体的区域面积较小时,可以提升分割出目标物体的精准度。

图3是根据一示例性实施例示出的一种图像分割模型训练装置的框图。参照图3,该装置包括获取单元121,预测概率确定单元122,权重系数确定单元123,损失值确定单元124和调整单元125。

获取单元121,被配置为执行获取图像样本数据集合;所述图像样本数据集合包括被标注为正样本类别的图像样本数据,以及,被标注为负样本类别的图像样本数据;

预测概率确定单元122,被配置为执行将获取的所述图像样本数据集合输入到待训练的图像分割模型中,得到所述待训练的图像分割模型输出的各类别的预测概率;

权重系数确定单元123,被配置为执行根据所述图像样本数据集合中不同样本类别的图像样本数据的数量,确定预设损失函数包含的权重系数;其中,所述权重系数,包括所述预设损失函数的第一评估部分的第一权重系数和第二评估部分的第二权重系数中的至少一个;所述第一评估部分用于确定标注类别的预测概率相对于1的损失值;所述第二评估部分用于确定非标注类别的预测概率相对于0的损失值;

损失值确定单元124,被配置为执行根据所述预设损失函数、确定出的所述权重系数和所述预测概率,确定损失值;

调整单元125,被配置为执行根据所述损失值调整所述待训练的图像分割模型的模型参数,直至调整所述模型参数后得到的图像分割模型的符合预设标准时,将符合预设标准的图像分割模型作为训练好的图像分割模型。

上述装置实施例的具体工作流程是,获取单元121,获取图像样本数据集合;预测概率确定单元122,将获取的所述图像样本数据集合输入到待训练的图像分割模型中,得到所述待训练的图像分割模型输出的各类别的预测概率;权重系数确定单元123,根据所述图像样本数据集合中不同样本类别的图像样本数据的数量,确定预设损失函数包含的权重系数;损失值确定单元124,根据所述预设损失函数、确定出的所述权重系数和所述预测概率,确定损失值;调整单元125,根据所述损失值调整所述待训练的图像分割模型的模型参数,直至调整所述模型参数后得到的图像分割模型的符合预设标准时,将符合预设标准的图像分割模型作为训练好的图像分割模型。

在一种实施方式中,所述第一权重系数和所述第二权重系数,用于在正样本类别的图像样本数据的数量多于负样本类别的图像样本数据的数量时,降低第一评估部分得到的损失值的权重,或提高第二评估部分得到的损失值的权重;或,所述第一权重系数和所述第二权重系数,用于在负样本类别的图像样本数据的数量多于正样本类别的图像样本数据的数量时,提高第一评估部分得到的损失值的权重,或降低第二评估部分得到的损失值的权重。

在一种实施方式中,所述第一权重系数包含负样本类别的图像样本数据的数量与正样本类别的图像样本数据的数量的比值;所述第二权重系数包含正样本类别的图像样本数据的数量与负样本类别的图像样本数据的数量的比值。

在一种实施方式中,所述第一权重系数为:

α1=(ni/nj)0.5

所述第二权重系数为:

α2=(nj/ni)0.5

其中,ni为负样本类别的图像样本数据的数量,nj为正样本类别的图像样本数据的数量。

在一种实施方式中,所述预设损失函数的表达式为:

l=-α1×label×log(predict)-(1-label)×log(1-predict);

l=-label×log(predict)-α2×(1-label)×log(1-predict);

l=-α1×label×log(predict)-α2×(1-label)×log(1-predict);

其中,label为人工标注的训练样本的标注类别,predict为所述图像分割模型输出的预测类别。

在一种实施方式中,所述正样本类别的图像样本数据为图像中的头发部分的像素,所述负样本类别的图像样本数据为图像中非头发部分的像素。

关于上述实施例中的装置,其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

本公开实施例,通过图像分割模型训练装置,在进行图像分割模型的训练时,将获取到的图像样本数据输入到待训练的图像分割模型中,得到所述图像分割模型输出的各类别的预测概率,根据图像样本数据的数量,确定预设损失函数的权重系数,根据预设损失函数、确定出的权重系数和预测概率,确定损失值,根据损失值调整所述图像分割模型的模型参数,在该过程中,预设损失函数包括第一评估部分和第二评估部分,第一评估部分确定标注类别的预测概率相对于1的损失值;第二评估部分确定非标注类别的预测概率相对于0的损失值。通过第一评估部分和第二评估部分,可以分别根据标注类别的预测概率相对于1的损失值,以及非标注类别的预测概率相对于0的损失值,这样得到的损失值能够准确反映预测概率相对于期望概率的差距,能够提高训练的模型数据分类的精准度。

另外,所述第一评估部分包括第一权重系数,和/或,所述第二评估部分包括第二权重系数,且第一权重系数和第二权重系数,可以是根据不同样本类别的图像样本数据的数量确定出的,以能够在正样本类别的图像样本数据的数量与负样本类别的图像样本数据的数量不同时,平衡第一评估部分和第二评估部分得到的损失值的权重。这样,即使样本中正负样本数量不平衡,相对于不添加权重系数而言,也可以缩小第一评估部分和第二评估部分得到的损失值的差距,进而提升模型数据分类的精准度。

图4是根据一示例性实施例示出的一种图像分割装置的框图。参照图3,该装置包括图像获取单元221,分割单元222。

该图像获取单元221被配置为执行获取待分割的包含目标物体的图像;

该分割单元222被配置为执行将所述包含目标物体的图像输入到所述训练好的图像分割模型中,以得到分割出的目标物体。

上述装置实施例的具体工作流程是,图像获取单元221,获取待分割的包含目标物体的图像,分割单元222,执行将所述包含目标物体的图像输入到所述训练好的图像分割模型中,以得到分割出的目标物体。

采用本公开实施例中图像分割装置,可以准确分割出图像中目标物体,尤其在图像中目标物体的区域面积较小时,可以提升分割出目标物体的准确度。

图5为实现本公开各个实施例的一种移动终端的硬件结构示意图,该移动终端300包括但不限于:射频单元401、网络模块402、音频输出单元403、输入单元404、传感器405、显示单元406、用户输入单元407、接口单元408、存储器409、处理器410、以及电源411等部件。本领域技术人员可以理解,图5中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。

其中,处理器410,用于获取图像样本数据集合;所述图像样本数据集合包括被标注为正样本类别的图像样本数据,以及,被标注为负样本类别的图像样本数据;将获取的图像样本数据集合输入到待训练的图像分割模型中,得到待训练的图像分割模型输出的各类别的预测概率;根据图像样本数据集合中不同样本类别的图像样本数据的数量,确定预设损失函数包含的权重系数;其中,所述权重系数,包括预设损失函数的第一评估部分的第一权重系数和第二评估部分的第二权重系数中的至少一个;所述第一评估部分用于确定标注类别的预测概率相对于1的损失值;所述第二评估部分用于确定非标注类别的预测概率相对于0的损失值;根据预设损失函数、确定出的权重系数和预测概率,确定损失值;根据损失值调整待训练的图像分割模型的模型参数,直至调整模型参数后得到的图像分割模型的符合预设标准时,将符合预设标准的图像分割模型作为训练好的图像分割模型。

存储器409,用于存储可在处理器410上运行的计算机程序,该计算机程序被处理器410执行时,实现处理器410所实现的上述功能。

应理解的是,本发明实施例中,射频单元401可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器410处理;另外,将上行的数据发送给基站。通常,射频单元401包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元401还可以通过无线通信系统与网络和其他设备通信。

移动终端通过网络模块402为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元403可以将射频单元401或网络模块402接收的或者在存储器409中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元403还可以提供与移动终端400执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元403包括扬声器、蜂鸣器以及受话器等。

输入单元404用于接收音频或视频信号。输入单元404可以包括图形处理器(graphicsprocessingunit,gpu)4041和麦克风4042,图形处理器4041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元406上。经图形处理器4041处理后的图像帧可以存储在存储器409(或其它存储介质)中或者经由射频单元401或网络模块402进行发送。麦克风4042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元401发送到移动通信基站的格式输出。

移动终端400还包括至少一种传感器405,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板4061的亮度,接近传感器可在移动终端400移动到耳边时,关闭显示面板4061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器405还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。

显示单元406用于显示由用户输入的信息或提供给用户的信息。显示单元406可包括显示面板4061,可以采用液晶显示器(liquidcrystaldisplay,lcd)、有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板4061。

用户输入单元407可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元407包括触控面板4071以及其他输入设备4072。触控面板4071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板4071上或在触控面板4071附近的操作)。触控面板4071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器410,接收处理器410发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板4071。除了触控面板4071,用户输入单元407还可以包括其他输入设备4072。具体地,其他输入设备4072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。

进一步的,触控面板4071可覆盖在显示面板4061上,当触控面板4071检测到在其上或附近的触摸操作后,传送给处理器410以确定触摸事件的类型,随后处理器410根据触摸事件的类型在显示面板4061上提供相应的视觉输出。虽然在图4中,触控面板4071与显示面板4061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板4071与显示面板4061集成而实现移动终端的输入和输出功能,具体此处不做限定。

接口单元408为外部装置与移动终端400连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(i/o)端口、视频i/o端口、耳机端口等等。接口单元408可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端400内的一个或多个元件或者可以用于在移动终端400和外部装置之间传输数据。

存储器409可用于存储软件程序以及各种数据。存储器409可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器409可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器410是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器409内的软件程序和/或模块,以及调用存储在存储器409内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器410可包括一个或多个处理单元;优选的,处理器410可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器410中。

移动终端400还可以包括给各个部件供电的电源411(比如电池),优选的,电源411可以通过电源管理系统与处理器410逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

另外,移动终端400包括一些未示出的功能模块,在此不再赘述。

优选的,本发明实施例还提供一种移动终端,包括处理器410,存储器409,存储在存储器409上并可在所述处理器410上运行的计算机程序,该计算机程序被处理器410执行时实现上述图像分割模型训练方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。

本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述图像分割模型训练方法

实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(read-onlymemory,简称rom)、随机存取存储器(randomaccessmemory,简称ram)、磁碟或者光盘等。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1