一种图像标注任务的预校验方法、装置、设备及存储介质与流程

文档序号:21547845发布日期:2020-07-17 17:59阅读:244来源:国知局
一种图像标注任务的预校验方法、装置、设备及存储介质与流程

本申请涉及人工智能技术领域,尤其涉及一种图像标注任务的预校验方法、装置、计算机设备及存储介质。



背景技术:

近年来,随着数据处理平台的不断发展,图像标注任务类型也越来越多样。为了满足不同类型的图像标注任务的准确性需求,往往需要针对性的任务流转机制与校验机制。

现有一种图像标注任务的校验方法,即在接收用户提交的数据标注信息之后,对该数据标注信息进行切割,并由校验系统对切割后的标注信息进行比对,筛选出内容相互一致的数据标注。

然而,传统的校验方法普遍不智能,当用户接收到图像标注任务时,可以对该图像标注任务进行任意标注,用户提交的数据标注信息普遍准确性较低,从而加大数据处理平台的工作量,进而降低数据处理平台的工作效率。



技术实现要素:

本申请实施例的目的在于提出一种图像标注任务的预校验方法,旨在解决现有的图像标注任务校验方法普遍准确性较低,工作效率低的问题。

为了解决上述技术问题,本申请实施例提供一种图像标注任务的预校验方法,采用了如下所述的技术方案:

接收用户终端发送的预校验请求,所述预校验请求至少携带有原始图像信息以及数据标注信息;

基于分流识别算法对所述原始图像信息进行分流识别操作,获取与所述原始图像信息相对应的锚点数据;

判断所述数据标注信息是否满足预设的锚点要求;

若满足所述预设的锚点要求,则向所述用户终端输出预校验成功信号。

为了解决上述技术问题,本申请实施例还提供一种图像标注任务的预校验装置,采用了如下所述的技术方案:

请求接收模块,用于接收用户终端发送的预校验请求,所述预校验请求至少携带有原始图像信息以及数据标注信息;

锚点获取模块,用于基于分流识别算法对所述原始图像信息进行分流识别操作,获取与所述原始图像信息相对应的锚点数据;

标注判断模块,用于判断所述数据标注信息是否满足预设的锚点要求;

结果输出模块,用于若满足所述预设的锚点要求,则向所述用户终端输出预校验成功信号。

为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:

包括存储器和处理器,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述图像标注任务的预校验方法的步骤。

为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:

所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述图像标注任务的预校验方法的步骤。

与现有技术相比,本申请实施例主要有以下有益效果:

本发明申请提供了一种图像标注任务的预校验方法,接收用户终端发送的预校验请求,所述预校验请求至少携带有原始图像信息以及数据标注信息;基于分流识别算法对所述原始图像信息进行分流识别操作,获取与所述原始图像信息相对应的锚点数据;判断所述数据标注信息是否满足预设的锚点要求;若满足所述预设的锚点要求,则向所述用户终端输出预校验成功信号。通过获取锚点数据判断用户的数据标注信息是否满足该锚点要求,从而能够提高用户提交的数据标注信息的准确性,进而减少数据处理平台的工作量,提高数据处理平台的工作效率。

附图说明

为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的图像标注任务的预校验方法的实现流程图;

图2是本发明实施例一提供的一种数据标注信息的示意图;

图3是本发明实施例一提供的另一种数据标注信息的示意图;

图4是本发明实施例一提供的锚点要求的示意图;

图5是图1中步骤s102的实现流程图;

图6是图1中步骤s103的实现流程图;

图7是图6中步骤s303的实现流程图;

图8是图7中步骤s402的实现流程图;

图9是本发明实施例二提供的图像标注任务的预校验装置的结构示意图;

图10是本发明实施例二提供的锚点获取模块的结构示意图;

图11是根据本申请的计算机设备的一个实施例的结构示意图。

具体实施方式

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。

本发明实施例提供的图像标注任务的预校验方法,通过获取锚点数据并判断用户的数据标注信息是否满足该锚点,从而能够提高用户提交的数据标注信息的准确性,进而减少数据处理平台的工作量,提高数据处理平台的工作效率。

实施例一

图1示出了本发明实施例一提供的图像标注任务的预校验方法的实现流程图,为了便于说明,仅示出与本发明相关的部分。

在步骤s101中,接收用户终端发送的预校验请求,所述预校验请求至少携带有原始图像信息以及数据标注信息。

在本发明实施例中,用户终端可以是诸如移动电话、智能电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字tv、台式计算机等等的固定终端,应当理解,此处对用户终端的举例仅为方便理解,不用于限定本发明。

在本发明实施例中,原始图像信息指的是需要通过用户在图片中用画线的方式标记一些指定位置的图像信息,比如图中指定文字的位置,并且一般会限制用户只能画直线,或者由线段组成的不同形状。

在本发明实施例中,数据标注信息指的是上述直线、各个线段的端点坐标组合组成的不同形状。作为示例,如图2所示,数据标注信息为[(2,6),(5,5)];再如图3所示,数据标注信息为[(2,6),(5,5)]、[(5,5),(7,7)]、[(7,7),(4,8)]和[(4,8),(2,6)],应当理解,此处对数据标注信息的举例仅为方便理解,不用于限定本发明。

在步骤s102中,基于分流识别算法对所述原始图像信息进行分流识别操作,获取与所述原始图像信息相对应的锚点数据。

在本发明实施例中,分流识别算法指的是将该原始图像信息分别进行行切割、全文识别以及列切割操作,从而以原始图像信息中的文字为单位将该原始图像进行切割,并以识别出的文字作为锚点数据。

在本发明实施例中,锚点指的是该原始图像信息上设置的标记,用于给标准数据标注设置一定的阈值范围,以确定用户提交的数据标注信息是否满足该阈值范围。

在步骤s103中,判断所述数据标注信息是否满足预设的锚点要求。

在本发明实施例中,锚点要求用于检测用户提交的数据标注信息是否经过一组锚点,作为示例,如图4所示,锚点要求为(2,5)和(5,7),那么数据标注信息[(2,6),(5,5)]经过锚点(2,5)和(5,7)之间,即数据标注信息[(2,6),(5,5)]满足该锚点要求,应当理解,此处锚点要求的举例仅为方便理解,不用于限定本发明。

在步骤s104中,若满足所述预设的锚点要求,则向所述用户输出预校验成功信号。

在本发明实施例中,向用户输出预校验信号可以是通过在用户终端的显示装置上展示,也可以通过简讯的方式进行展示,不用于限定本发明。

在本发明实施例中,本发明申请提供了一种图像标注任务的预校验方法,接收用户终端发送的预校验请求,所述预校验请求至少携带有原始图像信息以及数据标注信息;基于分流识别算法对所述原始图像信息进行分流识别操作,获取与所述原始图像信息相对应的锚点数据;判断所述数据标注信息是否满足预设的锚点要求;若满足所述预设的锚点要求,则向所述用户终端输出预校验成功信号。通过获取锚点数据并判断用户的数据标注信息是否满足该锚点,从而能够提高用户提交的数据标注信息的准确性,进而减少数据处理平台的工作量,提高数据处理平台的工作效率。

继续参考图5,示出了图1中步骤s102的实现流程图,为了便于说明,仅示出与本发明相关的部分。

作为实施例一的一些可选实现方式中,上述步骤s102具体包括:步骤s201、步骤s202、步骤s203、步骤s204以及步骤s205。

在步骤s201中,对所述原始图像信息进行行切割操作,获取行图像信息。

在本发明实施例中,行切割操作指的是将该原始图像通过行的形式进行分割,其中,行的高度不做具体限定,用户可根据实际情况进行适应调整。

在本发明实施例中,行图像信息指的是该原始图像通过行的形式进行分割后的图像信息。

在步骤s202中,对所述行图像信息进行识别操作,获取文本框。

在本发明实施例中,识别操作指的是识别上述行图像信息中的文字内容,当识别到文字内容时,通过文本框的形式对该文字内容位置进行标识。

在步骤s203中,根据所述文本框对所述原始图像信息进行列切割操作,获取多列携带有所述文本框的列图像信息。

在本发明实施例中,列切割操作指的是将该原始图像通过列的形式进行分割,其中,由于在步骤s202中已获得识别到的文本框,那么在对原始图像信息进行列切割操作时则以该原始图像信息中的文本框为基准进行分割,从而将原始图像信息中的文字内容分割开来。

在步骤s204中,在每相邻两列的所述列图像信息中各选取一个文本框组成文本框组。

在本发明实施例中,当列图像信息中仅存在一个文本框时,则选取该仅存的文本框组成该文本框组;当列图像信息存在多个文本框时,用户可根据实际情况进行限定选取的方式获取组成该文本框组的文本框,作为示例,例如通过随机选取的方式获取,再例如通过相对距离的方式选取,应当理解,此处对获取方式的举例仅为方便理解,不用于限定本发明实施例。

在步骤s205中,将所述文本框组中所述文本框的中心点作为所述锚点数据。

在本发明实施例中,先通过对原始图像信息进行行切割操作获取行图像信息,从而方便对图像信息中的文字内容进行识别;再通过对行图像信息进行识别操作获取文本框,从而确定原始图像信息中文字内容的具体位置;最后基于文本框确定锚点数据,从而规范限定了用户标注数据的有效范围,有效规范用户的标注操作。

作为本发明实施例一的一些可选实现方式中,上述步骤s203具体包括如下步骤:

以纵向穿过的文本框数量最少的直线作为列切割线进行切割。

在本发明实施例中,通过选取穿过文本框数量最少的直线作为列切割线进行切割,从而保证切割后的有效文本框尽可能的多,进而保证该锚点设定的准确性。

作为本发明实施例一的一些可选实现方式中,上述步骤s204具体包括:

在所述相邻两列的列图像信息中以纵轴方向相距最远的的两个文本框作为所述文本框组。

图6是图1中步骤s103的实现流程图,为了便于说明,仅示出与本发明相关的部分。

作为本发明实施例一的一些可选实现方式中,上述步骤s103具体包括:步骤s301、步骤s302、步骤s303以及步骤s304。

在步骤s301中,在同一坐标系中获取与所述数据标注信息以及锚点数据相对应的第一方程式以及第二方程式。

在本发明实施例中,假设算法在原始图像信息中找出了一组锚点,点a与点b,用户提交的标注数据标注中必须有线经过点a与点b之间,即线段ab一定与用户数据标注中的某条线段有交点。

建立第一方程式以及第二方程式:

第一方程式:假设点a的坐标为(xa,ya),点b的坐标为(xb,yb),且xa≤xb,则可根据一条线段上的两点坐标求出该线段的方程:(yb-ya)x+(xa-xb)y+xb*ya-xa*yb=0(xa≤x≤xb)。

第二方程式:根据用户提交的数据标注中每条线段的端点坐标,可以求出每条线段的方程,例如:线段mn中端点m的坐标(xm,ym),端点n的坐标为(xn,yn),且xn≤xm,则线段mn的方程为:(yn-ym)x+(xm-xn)y+xn*ym-xm*yn=0(xn≤x≤xm)。

在步骤s302中,判断所述第二方程式以及所述第一方程式相对应的线上是否存在交点。

将线段ab与用户画出的每条线段联立方程组,若方程组在定义域内有且只有一个解,说明该条线段经过锚点a与b之间。以线段mn为例,判断线段mn是否经过锚点a与b之间的方法如下:

①联立方程组:

②方程组不考虑定义域时唯一解的横坐标为:

③若唯一解的横坐标符合定义域要求xa≤x*≤xb且xn≤x*≤xm,则认为线段mn与线段ab在定义域内有交点,即锚点a与锚点b之间有线经过。

在本发明实施例中,x*符合定义域xa≤x*≤xb且xn≤x*≤xm的要求,即第二方程式上存在与所述第一方程式相交的交点,说明用户提交的数据标注有线经过点a与点b之间。

在步骤s303中,若所述第二方程式以及所述第一方程式相对应的线上存在交点,则输出所述预校验成功信号。

在步骤s304中,若所述第二方程式以及所述第一方程式相对应的线上不存在交点,则输出预校验失败信号。

在本发明实施例中,通过判断两条线段是否相交的逻辑,用坐标和方程组的方式形成判断公式,能够很好地规范用户提交的答案,降低众包用户骗取积分的概率,使众包平台在更短的时间内拿到更准确的答案,提高图像标注类众包任务的答案可靠性。

图7是图6中步骤s303的实现流程图,为了便于说明,仅示出与本发明相关的部分。

作为本发明实施例一的一些可选实现方式中,上述步骤s303具体包括:步骤s401、步骤s402以及步骤s403。

在步骤s401中,若所述判断结果为是,则判断所述第一方程式以及第二方程式相对应的线是否相互平行或者重合。

在本发明实施例中,以上述联立的方程组为例,可以通过判断是否等于从而确定第一方程式以及第二方程式是否相互平行或者重合。

在步骤s402中,若所述第一方程式以及第二方程式相对应的线不是相互平行或者重合,则输出所述预校验成功信号。

在步骤s403中,若所述第一方程式以及第二方程式相对应的线相互平行或者重合,则输出所述预校验失败信号。

图8是图7中步骤s402的实现流程图,为了便于说明,仅示出与本发明相关的部分。

作为本发明实施例一的一些可选实现方式中,上述步骤s402具体包括:步骤s501、步骤s502、步骤s503以及步骤s504。原始图像信息标注任务还携带有无效锚点数据。

在步骤s501中,在同一坐标系中获取与所述数据标注信息以及无效锚点数据相对应的第三方程式以及第四方程式。

在本发明实施例中,无效锚点数据指的是原始图像信息标注任务预先设定的不能经过的区域,例如,在原始图像信息的文件签名、文件抬头等位置只是用于标识该文件,与该原始图像信息标注任务毫无关联,当用户在该位置进行标注时,显然不符合原始图像信息标注任务的要求,因此,需要在原始图像信息标注任务中预先设置无效锚点的位置。

在本发明实施例中,第三方程式指的是无锚点数据联立的方程,假设无效锚点中点c的坐标为(xc,yc),点d的坐标为(xd,yd),且xc≤xd,则可根据一条线段上的两点坐标求出该线段的第三方程式为:(yd-yc)x+(xc-xd)y+xd*yc-xc*yd=0(xc≤x≤xd)。

在本发明实施例中,第四方程式指的是用户提交数据标注信息的端点所联立的方程,假设用户提交的数据标注信息两个端点为q(xq,yq),p(xp,yp):

那么第四方程式则为:(yp-yq)x+(xq-xp)y+xp*yq-xq*yp=0(xq≤x≤xp)。

在步骤s502中,判断所述第四方程式以及所述第三方程式相对应的线上是否存在交点。

①联立方程组:

②方程组不考虑定义域时唯一解的横坐标为:

③若唯一解的横坐标符合定义域要求xc≤x*≤xd且xq≤x*≤xp,则认为线段qp与线段cd在定义域内有交点,即锚点c与锚点d之间有线经过。

在步骤s503中,若所述第四方程式以及所述第三方程式相对应的线上存在交点,则输出所述预校验失败信号。

在步骤s504中,若所述第四方程式以及所述第三方程式相对应的线上不存在交点,则输出所述预校验成功信号。

综上所述,本发明申请提供了一种图像标注任务的预校验方法,接收用户终端发送的预校验请求,所述预校验请求至少携带有原始图像信息以及数据标注信息;基于分流识别算法对所述原始图像信息进行分流识别操作,获取与所述原始图像信息相对应的锚点数据;判断所述数据标注信息是否满足预设的锚点要求;若满足所述预设的锚点要求,则向所述用户终端输出预校验成功信号。通过获取锚点数据并判断用户的数据标注信息是否满足该锚点要求,从而能够提高用户提交的数据标注信息的准确性,进而减少数据处理平台的工作量,提高数据处理平台的工作效率。同时,先通过对原始图像信息进行行切割操作获取行图像信息,从而方便对图像信息中的文字内容进行识别,再通过对行图像信息进行识别操作获取文本框,从而确定原始图像信息中文字内容的具体位置,最后基于文本框确定锚点数据,从而规范限定了用户标注数据的有效范围,有效规范用户的标注操作;通过判断两条线段是否相交的逻辑,用坐标和方程组的方式形成判断公式,能够很好地规范用户提交的答案,降低众包用户骗取积分的概率,使众包平台在更短的时间内拿到更准确的答案,提高图像标注任务标注类众包任务的答案可靠性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)等非易失性存储介质,或随机存储记忆体(randomaccessmemory,ram)等。

应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

实施例二

进一步参考图9,作为对上述图1所示方法的实现,本申请提供了一种图像标注任务的预校验装置,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如与9所示,本发明实施例二所提供的图像标注任务的预校验装置100包括:请求接收模块101、锚点获取模块102、标注判断模块103以及结果输出模块104。其中:

请求接收模块101,用于接收用户终端发送的预校验请求,所述预校验请求至少携带有原始图像信息以及数据标注信息;

锚点获取模块102,用于基于分流识别算法对所述原始图像信息进行分流识别操作,获取与所述原始图像信息相对应的锚点数据;

标注判断模块103,用于判断所述数据标注信息是否满足预设的锚点要求;

结果输出模块104,用于若满足所述预设的锚点要求,则向所述用户终端输出预校验成功信号。

在本发明实施例中,用户终端可以是诸如移动电话、智能电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字tv、台式计算机等等的固定终端,应当理解,此处对用户终端的举例仅为方便理解,不用于限定本发明。

在本发明实施例中,原始图像信息指的是需要通过用户在图片中用画线的方式标记一些指定位置的图像信息,比如图中指定文字的位置,并且一般会限制用户只能画直线,或者由线段组成的不同形状。

在本发明实施例中,数据标注信息指的是上述直线、各个线段的端点坐标组合组成的不同形状。作为示例,如图2所示,数据标注信息为[(2,6),(5,5)];再如图3所示,数据标注信息为[(2,6),(5,5)]、[(5,5),(7,7)]、[(7,7),(4,8)]和[(4,8),(2,6)],应当理解,此处对数据标注信息的举例仅为方便理解,不用于限定本发明。

在本发明实施例中,分流识别算法指的是将该原始图像信息分别进行行切割、全文识别以及列切割操作,从而以原始图像信息中的文字为单位将该原始图像进行切割,并以识别出的文字作为锚点数据。

在本发明实施例中,锚点指的是该原始图像信息上设置的标记,用于给标准数据标注设置一定的阈值范围,以确定用户提交的数据标注信息是否满足该阈值范围。

在本发明实施例中,锚点要求用于检测用户提交的数据标注信息是否有线段经过一组锚点之前,作为示例,如图4所示,锚点要求为(2,5)和(5,7),那么数据标注信息[(2,6),(5,5)]经过锚点(2,5)和(5,7)之间,即数据标注信息[(2,6),(5,5)]满足该锚点要求,应当理解,此处锚点要求的举例仅为方便理解,不用于限定本发明。

在本发明实施例中,向用户输出预校验信号可以是通过在用户终端的显示装置上展示,也可以通过简讯的方式进行展示,不用于限定本发明。

在本发明实施例中,本发明申请提供了一种图像标注任务的预校验装置,包括:请求接收模块,用于接收用户终端发送的预校验请求,所述预校验请求至少携带有原始图像信息以及数据标注信息;锚点获取模块,用于基于分流识别算法对所述原始图像信息进行分流识别操作,获取与所述原始图像信息相对应的锚点数据;标注判断模块,用于判断所述数据标注信息是否满足预设的锚点要求;结果输出模块,用于若满足所述预设的锚点要求,则向所述用户终端输出所述预校验成功信号。通过获取锚点数据并判断用户的数据标注信息是否满足该锚点,从而能够提高用户提交的数据标注信息的准确性,进而减少数据处理平台的工作量,提高数据处理平台的工作效率。

在本发明实施例二的一些可选的实现方式中,如图10所示,上述锚点获取模块102包括:行图像获取子模块1021、文本框获取子模块1022、列图像获取子模块1023、文本框组获取子模块1024以及锚点确定子模块1025。其中:

行图像获取子模块1021,用于对所述原始图像信息进行行切割操作,获取行图像信息;

文本框获取子模块1022,用于对所述行图像信息进行识别操作,获取文本框;

列图像获取子模块1023,用于根据所述文本框对所述原始图像信息进行列切割操作,获取多列携带有所述文本框的列图像信息;

文本框组获取子模块1024,用于在每相邻两列的所述列图像信息中各选取一个文本框组成文本框;

锚点确定子模块1025,用于将所述文本框组中所述文本框的中心点作为所述锚点数据。

在本发明实施例中,行切割操作指的是将该原始图像通过行的形式进行分割,其中,行的高度不做具体限定,用户可根据实际情况进行适应调整。

在本发明实施例中,行图像信息指的是该原始图像通过行的形式进行分割后的图像信息。

在本发明实施例中,识别操作指的是识别上述行图像信息中的文字内容,当识别到文字内容时,通过文本框的形式对该文字内容位置进行标识。

在本发明实施例中,列切割操作指的是将该原始图像通过列的形式进行分割,其中,由于在步骤s202中已获得识别到的文本框,那么在对原始图像信息进行列切割操作时则以该原始图像信息中的文本框为基准进行分割,从而将原始图像信息中的文字内容分割开来。

在本发明实施例中,当列图像信息中仅存在一个文本框时,则选取该仅存的文本框组成该文本框组;当列图像信息存在多个文本框时,用户可根据实际情况进行限定选取的方式获取组成该文本框组的文本框,作为示例,例如通过随机选取的方式获取,再例如通过相对距离的方式选取,应当理解,此处对获取方式的举例仅为方便理解,不用于限定本发明实施例。

在本发明实施例中,先通过对原始图像信息进行行切割操作获取行图像信息,从而方便对图像信息中的文字内容进行识别;再通过对行图像信息进行识别操作获取文本框,从而确定原始图像信息中文字内容的具体位置;最后基于文本框确定锚点数据,从而规范限定了用户标注数据的有效范围,有效规范用户的标注操作。

在本发明实施例二的一些可选的实现方式中,上述文本框组获取子模块1024包括:

文本框组确定子模块,用于在所述相邻两列的列图像信息中以纵轴方向相距最远的的两个文本框作为所述文本框组。

在本发明实施例二的一些可选的实现方式中,上述列图像获取子模块1023包括:

列切割线确定子模块,用于以纵向穿过的文本框数量最少的直线作为列切割线进行切割。

在本发明实施例二的一些可选的实现方式中,上述标注判断模块103包括:

第一方程式获取子模块,用于获取与所述数据标注信息以及锚点数据相对应的第一方程式以及第二方程式;

第一方程式判断子模块,用于判断所述第二方程式上是否存在与所述第一方程式相交的交点;

第一信号输出子模块,用于若所述第二方程式上存在与所述第一方程式相交的交点,则输出所述预校验成功信号;

第二信号输出子模块,用于若所述第二方程式上不存在与所述第一方程式相交的交点,则输出预校验失败信号。

在本发明实施例二的一些可选的实现方式中,上述第一信号输出子模块具体包括:

第二方程式判断子模块,用于若所述判断结果为是,则判断所述第一方程式以及第二方程式是否相互平行或者重合;

第三信号输出子模块,用于若所述第一方程式以及第二方程式不是相互平行或者重合,则输出所述预校验成功信号;

第四信号输出子模块,用于若所述第一方程式以及第二方程式相互平行或者重合,则输出所述预校验失败信号。

在本发明实施例二的一些可选的实现方式中,上述第三信号输出子模块具体包括:

第二方程式获取子模块,用于获取与所述数据标注信息以及无效锚点数据相对应的第三方程式以及第四方程式;

第三方程式判断子模块,用于判断所述第四方程式上是否存在与第三方程式相交的交点;

第五信号输出子模块,用于若所述第四方程式上存在与第三方程式相交的交点,则输出所述预校验失败信号;

第六信号输出子模块,用于若所述第四方程式上不存在与第三方程式相交的交点,则输出所述预校验成功信号。

实施例三

为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图11,图11为本实施例计算机设备基本结构框图。

所述计算机设备11包括通过系统总线相互通信连接存储器111、处理器112、网络接口113。需要指出的是,图中仅示出了具有组件111-113的计算机设备11,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程门阵列(field-programmablegatearray,fpga)、数字处理器(digitalsignalprocessor,dsp)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器111至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器111可以是所述计算机设备11的内部存储单元,例如该计算机设备11的硬盘或内存。在另一些实施例中,所述存储器111也可以是所述计算机设备11的外部存储设备,例如该计算机设备11上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。当然,所述存储器111还可以既包括所述计算机设备11的内部存储单元也包括其外部存储设备。本实施例中,所述存储器111通常用于存储安装于所述计算机设备11的操作系统和各类应用软件,例如图像标注任务的预校验方法的程序代码等。此外,所述存储器111还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器112在一些实施例中可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器112通常用于控制所述计算机设备11的总体操作。本实施例中,所述处理器112用于运行所述存储器111中存储的程序代码或者处理数据,例如运行所述图像标注任务的预校验方法的程序代码。

所述网络接口113可包括无线网络接口或有线网络接口,该网络接口113通常用于在所述计算机设备11与其他电子设备之间建立通信连接。

本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有图像标注任务的预校验程序,所述图像标注任务的预校验程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的图像标注任务的预校验方法的步骤。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。

显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1