图片标注方法和装置与流程

文档序号:15230307发布日期:2018-08-21 19:20阅读:267来源:国知局

本发明涉及数据处理技术领域,具体而言,涉及一种图片标注方法和装置。



背景技术:

在进行数据标注时,对于带有主观性或概念比较模糊的主观性指标(定性指标),可能由于标注者的知识水平、认知能力和个人偏好影响等,很难完全排除人为因素带来的标注偏差,进而导致标注质量难以保证,且结果会随标注人员的不同而有较大浮动。而现有的自主采集面临着标注前期的人员培训成本较大,耗费大量的人力、财力、物力,且最终效果也无法准确把控,因此,急需一种针对定性指标进行稳定性、可靠性的图片标注方法以解决上述问题。



技术实现要素:

有鉴于此,本发明实施例提供一种图片标注方法和装置,能有效解决上述问题。

本发明较佳实施例提供一种图片标注方法所述方法包括:

选取待标注图片,对所述待标注图片进行标准化处理;

响应用户根据预设标注标准对标准化处理后的待标注图片进行标注的标注动作;

根据所述标注动作生成标注结果,并将该标注结果与所述待标注图片进行对应保存。

在本发明较佳实施例的选择中,在基于所述预设标注标准,响应用户根据预设标注标准对标准化处理后的待标注图片进行标注的标注动作的步骤之前,所述方法还包括:

确定标注指标并对标注指标进行分类,将分类结果作为预设标注标准。

在本发明较佳实施例的选择中,所述待标注图片中包括多张用于对标注结果进行校验的校验图片和多张待标注子图片,所述方法还包括:

针对每个完成标注的所述校验图片对应的标注结果,判断该标注结果是否与预设标准结果匹配:

统计标注结果与预设标准结果匹配的校验图片的数量,判断统计结果是否满足预设值,若不满足,则判定所述待标注图片组中的全部图片标注失败,并进行重新标注提示。

在本发明较佳实施例的选择中,所述待标注图片组中的校验图片的数量与实际标注图片的数量满足预设比例。

在本发明较佳实施例的选择中,对所述待标注图片进行标准化处理时的标准化参数包括图片大小、缩放比例、图片分辨率、屏幕分辨率中的一个或多个。

在本发明较佳实施例的选择中,所述方法还包括:

将完成标注的所述待标注图片组中的全部图片输入预设校验模型中进行校验,并输出与预设标准结果不匹配的标注结果;

将与所述预设标准结果不匹配的标注结果对应的待标注图片进行重新标注提示。

本发明实施例还提供一种图片标注装置,所述装置包括:

图片选取模块,用于选取待标注图片,对所述待标注图片进行标准化处理;

标注响应模块,用于响应用户根据预设标注标准对标准化处理后的待标注图片进行标注的标注动作;

结果生成模块,用于根据所述标注动作生成标注结果,并将该标注结果与所述待标注图片进行对应保存。

在本发明较佳实施例的选择中,所述装置还包括:

标准设定模块,用于确定标注指标并对标注指标进行分类,将分类结果作为预设标注标准。

在本发明较佳实施例的选择中,所述待标注图片中包括多张用于对标注结果进行校验的校验图片和多张待标注子图片,所述装置还包括:

匹配验证模块,用于针对每个完成标注的所述校验图片对应的标注结果,判断该标注结果是否与预设标准结果匹配:

统计分析模块,用于统计标注结果与预设标准结果匹配的校验图片的数量,判断统计结果是否满足预设值,若不满足,则判定所述待标注图片组中的全部图片标注失败,并进行重新标注提示。

在本发明较佳实施例的选择中,所述待标注图片组中的校验图片的数量与实际标注图片的数量满足预设比例。

与现有技术相比,本发明实施例提供一种图片标注方法和装置,其中,通过对标注过程中出现的定性指标进行定量化处理,能够对图片标注过程中出现的主观因素进行精确控制,避免在图片标注过程中出现的由于标注人员的主观因素等导致的标注偏差,提高标注结果的稳定性和可靠性。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提供的电子终端的方框示意图。

图2为本发明实施例提供的图片标注方法的流程示意图。

图3为本发明实施例提供的图片标注方法的另一流程示意图。

图4为本发明实施例提供的图片标注方法的又一流程示意图。

图5为本发明实施例提供的图片标注装置的方框结构示意图。

图标:10-电子终端;100-图片标注装置;110-图片选取模块;120-标注响应模块;130-结果生成模块;140-标准设定模块;150-匹配验证模块;160-统计分析模块;200-存储器;300-存储控制器;400-处理器。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

如图1所示,为本发明实施例提供的电子终端10的方框结构示意图,该电子终端10包括图片标注装置100、存储器200、存储控制器300以及处理器400。其中,所述存储器200、存储控制器300、处理器400各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件之间通过一条或多条通讯总线或信号线实现电性连接。所述图片标注装置100包括至少一个可以软件或固件的形式存储于所述存储器200中或固化在所述电子终端10的操作系统中的软件功能模块。所述处理器400在所述存储控制器300的控制下访问所述存储器200,以用于执行所述存储器200中存储的可执行模块,例如所述图片标注装置100所包括的软件功能模块及计算机程序等。可选地,所述电子终端10可以是,但不限于智能手机、个人电脑(personalcomputer,pc)、平板电脑、个人数字助理(personaldigitalassistant,pda)、移动上网设备(mobileinternetdevice,mid)等。

可以理解,图1所示的结构仅为示意,所述电子终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。

请结合参阅图2,为本发明实施例提供的一种应用于所述电子终端10的图片标注方法的流程示意图,所述方法有关的流程所定义的方法步骤可以由所述处理器400实现。下面将对图2所示的具体流程进行详细阐述。

步骤s110,选取待标注图片,对所述待标注图片进行标准化处理。

其中,由于在对具有主观因素的图片进行标注时,可能由于图片大小、图片分辨率、屏幕分辨率的不同等导致对图片进行标注时出现不同的标注结果,因此,在实际标注过程中,首先会对待标注图片进行标准化处理,以解决上述问题,如以屏幕分辨率为例,需统一标注人员使用的屏幕分辨率,再在此屏幕分辨率下去调整图片的缩放比例,以一个固定的缩放比例去观测待标注图片,从而控制客观变量,保证尺度的一致性等。可选地,对所述待标注图片进行标准化处理时的标准化参数可以包括但不限于图片大小、缩放比例、图片分辨率、屏幕分辨率等中的一个或多个,本实施例对此不做限制。

步骤s120,响应用户根据预设标注标准对标准化处理后的待标注图片进行标注的标注动作。

本实施例中,所述预设标注标准是指对于带有主观性的标注,通过对定性指标采用定量化的处理方法,例如,对模糊的主观性概念进行拆解,或者对于无法量化的指标采用等级划分的方式等确定标注标准,如程度评价中的无-轻-中-重等,并将最终确定的标注标准作为预设标注标准。最后基于该预设标注标准对参与标注的标注人员进行统一培训,以实现对标注对象的统一化理解,进而减少个体认知差异带来的标注偏差。因此,本实施例在执行步骤s120之前,首先需要确定标注指标并对标注指标进行分类,将分类结果作为预设标注标准。

可选地,在一个实施例中,假设所述待标注图片中的待标注对象为人物面部有无毛孔粗大的问题,但由于毛孔是否粗大具有主观性,如对于不同的图片,由于拍摄角度等的不同会导致毛孔呈现出千奇百态,进而使得无法对毛孔进行量化,加之对于“粗大”这种程度性的判断,会受标注人员的个体主观性影响,因此,对于毛孔是否粗大的问题可采用程度评价。具体地,首先可将毛孔的开口面积和毛孔的深度作为衡量指标,然后根据图片整体情况,并按照无-轻-中-重四个程度等级挑选出每个等级最具有代表性的一张或几张图片,并规定开口面积和毛孔深度小于某张图片所显示的程度,即算无;反之开口面积和毛孔深度大于某张图片所显示的程度,即算有,最后可将四个程度等级无-轻-中-重作为预设标注标准使得标注人员基于该预设标注标准判断是否存在毛孔粗大问题并进行标注。

应理解的是,在实际标注时,除上述的程度标注,还有类型标注(判断图片上的事物属于哪一类)、有无标注(判断图片上是否有符合标注项的事物)等,本实施例在此不做具体限制。此外,上述的待标注图片中可能包括多张待标注子图片,并由多个经过统一培训的标注人员分组进行标注完成,本实施例在此不做限制。

步骤s130,根据所述标注动作生成标注结果,并将该标注结果与所述待标注图片进行对应保存。

其中,在根据标注动作生成标注结果时,可将标注结果直接添加并显示在所述待标注图片上,并在标注人员确定无误后进行对应保存。可选地,所述标注结果可以是文字、图形、数字等,本实施例在此不做限制。

为了进一步控制标注人员在标注过程由于外界因素和主观感受引起的标注标准浮动,本实施例还通过采用reject机制,进行强化学习,解决该问题,具体如图3中所示的步骤s140和步骤s150。

步骤s140,针对每个完成标注的所述校验图片对应的标注结果,判断该标注结果是否与预设标准结果匹配。

首先需要说明的是,所述待标注图片中可包括多张用于对标注结果进行校验的校验图片和多张待标注子图片。换言之,在执行步骤s140之前,首先将多张校验图片和多张待标注子图片按照预设比例进行混合,如将m张待标注子图片和n张校验图片进行混合,即以m+n张图片作为一个标注单元(即上述的待标注图片),且n张校验图片在标注单元中随机分布。然后按照步骤s110-步骤s130中的标注过程对所述多张校验图片和多张待标注子图片分别进行标注。最后针对每个完成标注的所述校验图片对应的标注结果,判断该标注结果是否与预设标准结果匹配。

其中,所述预设标准结果为预先按照预设标注标准对所述校验图片进行标注的标注结果,并将该标注结果保存为预设标准结果。例如,在实际实施时,所述预设标准结果可以是需求方按照已经确认的预设标注标准给出一组校验图,如标注图片人物有无毛孔粗大,则校验图片的标注结果就是有和无。

步骤s150,统计标注结果与预设标准结果匹配的校验图片的数量,判断统计结果是否满足预设值,若不满足,则判定所述待标注图片组中的全部图片标注失败,并进行重新标注提示。

本实施例中,所述预设值可根据实际需求进行灵活设计,例如,所述预设值可以是但不限于50%、60%等。另外,在统计结果不满足预设值时,判定所述待标注图片组中的全部图片标注失败,并按照步骤s110-步骤s130进行重新标注,直到标注结果完全一致。

进一步地,如图4所示,本实施例还通过步骤s160-步骤s170对标注结果的一致性进行再次验证,具体如下。

步骤s160,将完成标注的所述待标注图片组中的全部图片输入预设校验模型中进行校验,并输出与预设标准结果不匹配的标注结果;

步骤s170,将与所述预设标准结果不匹配的标注结果对应的待标注图片进行重新标注提示。

步骤s160-步骤s170用于进一步对所述标注结果的一致性进行验证,降低标注过程中由于主观因素造成的标注偏差。其中,所述预设校验模型是基于已有的标注结果生成,再利用此预设校验模型检验生成该预设校验模型的数据,并筛选出模型得出的结果与标注结果不符的标注结果数据,对这部分标注结果数据对应的待标注图片进行二次标注,同时实现对模型进行迭代以提高模型精准度,如针对毛孔粗大问题,将待标注图片输出入预设校验模型(由毛孔粗大问题的标注结果生成)中以判断该图片中的人脸有无毛孔粗大问题。

在此需要说明的是,上述的预设校验模型是基于卷积神经网络(convolutionalneuralnetworks,cnn)训练得到的模型。其中,该卷积神经网络包括数据输入层(inputlayer)、卷积计算层(convlayer)、池化层(poolinglayer)、全连接层(fullyconnectedlayer),所述数据输入层用于输入训练图片(完成标注的标准的待标注图片),所述卷积计算层用于基于一个或多个滤波器提取图像特征,如垂直边缘、水平边缘、颜色、纹理等,所述池化层用于在卷积计算层的基础上进一步提取图片上的重要特征,所述全连接层用于对经过卷积计算层和池化层提取出的局部图片特征重新通过权值矩阵组合成完整的图片。可选地,根据实际需求,所述卷积计算层、池化层的数量可根据实际需求的不同灵活选取。

详细地,在此以有无毛孔粗大为例,那么可将一批标注为有/无毛孔粗大的图片输入到卷积神经网络中进行训练(网络结构和具体参数会根据实际情况调整),网络会通过训练学习提取出有毛孔粗大的特征和无毛孔粗大的特征,得到一个能预测有无毛孔粗大的预设校验模型。进而,当再次基于该预设校验模型输入一张新的待标注图片时,该预设校验模型会比对这张图片上的特征和之前学习的特征并做出判断。

另外,除上述模型验证之外,还可采用人工校验的方式对标注结果进行校验,如对同一组标注人员对同一批图片的标注结果进行抽查等。

进一步地,基于对上述图片标注方法的描述,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序在执行时实现上述图2对应的方法实施例中描述的各个步骤。

请结合参阅图5,本发明实施例还提供一种可应用于所述电子终端10的图片标注装置100。所述图片标注装置100包括图片选取模块110、标注响应模块120、结果生成模块130、标准设定模块140、匹配验证模块150和统计分析模块160。

所述图片选取模块110,用于选取待标注图片,对所述待标注图片进行标准化处理;本实施例中,关于所述图片选取模块110的描述具体可参考上述步骤s110的详细描述,也即,所述步骤s110可以由图片选取模块110执行,因而在此不作更多说明。

所述标注响应模块120,用于响应用户根据预设标注标准对标准化处理后的待标注图片进行标注的标注动作;本实施例中,关于所述标注响应模块120的描述具体可参考上述步骤s120的详细描述,也即,所述步骤s120可以由标注响应模块120执行,因而在此不作更多说明。

所述结果生成模块130,用于根据所述标注动作生成标注结果,并将该标注结果与所述待标注图片进行对应保存。本实施例中,关于所述结果生成模块130的描述具体可参考上述步骤s130的详细描述,也即,所述步骤s130可以由结果生成模块130执行,因而在此不作更多说明。

所述标准设定模块140,用于确定标注指标并对标注指标进行分类,将分类结果作为预设标注标准。本实施例中,关于所述标准设定模块140的描述具体可参考上述步骤s120的详细描述,也即,所述步骤s120可以由标准设定模块140执行,因而在此不作更多说明。

所述匹配验证模块150,用于针对每个完成标注的所述校验图片对应的标注结果,判断该标注结果是否与预设标准结果匹配:本实施例中,关于所述匹配验证模块150的描述具体可参考上述步骤s140的详细描述,也即,所述步骤s140可以由匹配验证模块150执行,因而在此不作更多说明。

所述统计分析模块160,用于统计标注结果与预设标准结果匹配的校验图片的数量,判断所统计结果是否满足预设值,若不满足,则判定所述待标注图片组中的全部图片标注失败,并进行重新标注提示。本实施例中,关于所述统计分析模块160的描述具体可参考上述步骤s150的详细描述,也即,所述步骤s150可以由统计分析模块160执行,因而在此不作更多说明。

综上所述,本发明实施例提供一种图片标注方法和装置,其中,通过对标注过程中出现的定性指标进行定量化处理,能够对图片标注过程中出现的主观因素进行精确控制,避免在图片标注过程中出现的由于标注人员的主观因素等导致的标注偏差,提高标注结果的稳定性和可靠性。

在本发明的描述中,术语“设置”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其他方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的预设数量个实施例的装置、方法和计算机程序产品可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分。所述模块、程序段或代码的一部分包含一个或预设数量个用于实现规定的逻辑功能。

也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1