一种基于网络服务平台的数据标注系统及方法与流程

文档序号:20783270发布日期:2020-05-19 21:27阅读:322来源:国知局
一种基于网络服务平台的数据标注系统及方法与流程

本发明属于人工智能领域,涉及一种基于网络服务平台的数据标注系统及方法。



背景技术:

随着近些年深度学习的发展,在计算机视觉,自然语音处理等方面出现了一些极大的突破,而随着深度学习方法的迅速发展,数据标注的需求大增。带标注的海量数据是人工智能相关算法的粮食,而创建标记的训练数据是一个必要但成本高昂的业务,目前大多数标注数据都是人工注释的,这是一个非常缓慢而低效的过程,需要人坐在计算机屏幕前操作注释器,点击数据,逐个标记它们。并且,随着数据量的增加,这个过程会变得更加昂贵且容易出错。以imagenet为例,imagenet是目前世界上图像识别最大的数据库——1,500万张标注图片的数据集,这是来自167个国家的48,940名工作者,花费了2年时间,清理、分类、标记了近十亿张通过互联网搜集到的图片得到的。大量的标注好的数据可以训练出更加优秀的模型来解决现实场景需要,每一项ai技术的场景应用,背后都需要海量数据的支持。数据标注得越准确、数量越多,算法模型的效果就越好,高质量的数据标注决定一家ai公司的行业竞争力。目前市场上依然缺少基于网络服务平台的大规模标注数据的系统来解决这方面的需求,同时现有的标注软件可标注的类型仍然过于单一。



技术实现要素:

本发明目的是:提供一种基于网络服务平台的高效大规模标注数据的数据标注系统。

本发明的技术方案是:

第一方面,一种基于网络服务平台的数据标注系统,该基于网络服务平台的数据标注系统包括:软件客户端和网络服务平台;

所述软件客户端包括上传下载模块、手动标注模块、自动标注模块;所述网络服务平台包括任务发布者模块、任务管理员模块、任务标注者模块;

所述上传下载模块将任务所需要的标注数据和标注类型下载到软件客户端本地,标注完成后将标注结果上传到所述网络服务平台;

所述手动标注模块集成点标注、线标注、二维框标注中的至少一种;

所述自动标注模块实现语义分割标注可行驶区域分析,通过人工智能算法辅助标注;

所述任务发布者模块发布标注任务;

所述任务管理员模块管理标注任务进度;

所述任务标注者模块标注数据并上传标注结果。

其进一步的技术方案是:所述软件客户端还包括验收模块、解密模块、价格计算模块、远程更新模块、格式转换模块;

所述验收模块根据设置的验收模式对标注数据进行验收;

所述解密模块对标注数据进行高级加密;

所述价格计算模块统计已标注数据的标注个数和标注类型,根据标注个数和标注类型计算标注费用;

所述远程更新模块对软件进行远程更新;

所述格式转换模块对标注数据进行格式转换。

其进一步的技术方案是:所述自动标注模块集成基础标注、传感器融合标注、三维点云标注中的至少一种。

第二方面,一种基于网络服务平台的数据标注方法,应用于如第一方面所述的基于网络服务平台的数据标注系统中,所述数据标注方法包括:

通过任务发布者模块发布标注任务;

通过任务管理员模块进行标注任务的分配;

通过任务标注者模块接受标注任务;

通过上传下载模块下载标注数据到软件客户端本地;

通过自动标注模块和手动标注模块完成数据标注;

通过上传下载模块将标注结果上传至网络服务平台;

通过任务管理员模块在线检查标注结果;

若检查合格,则任务管理员模块上传最终标注结果;

若检查不合格,则将需要重新标注的数据发送到任务标注者模块,继续执行所述通过上传下载模块下载标注数据到软件客户端本地的步骤。

其进一步的技术方案是:所述若检查合格,则任务管理员模块上传最终标注结果之后,还包括:

通过价格计算模块统计已标注数据的标注个数和标注类型,根据标注个数和标注类型计算标注费用;

根据计算出的标注费用,通过任务管理员模块支付费用。

其进一步的技术方案是:所述通过自动标注模块和手动标注模块完成数据标注,包括:

采用深度学习算法对数据进行分析,训练得到分类检测特征;

通过卷积学习网络进行大样本训练,得到分类器;

通过分类器将数据中的目标对象提取出来,对提取到的对象自动打上标注;

通过人工对自动标注的结果进行检验。

本发明的优点是:

1.通过将自动标注和手动标注结合,弥补目前标注软件在大规模标注上效率的不足,基于网络服务平台集成统计评估管理功能,实现大规模数据标注任务的有效管理,能够同时对人员、标注进度和标注质量进行管理;

2.增加了验收模块、价格计算模块等,辅助验收人员对提交的标注数据进行评估,同时可以对工作量、标注质量和标注时间等进行统计;

3.通过集成基础标注、传感器融合标注和三维点云标注等,解决了目前标注系统在管理和标注类型上的不足,增加了3d标注功能,实现三维激光雷达点云和云图像联合标注;通过深度学习算法实现自动标注,大量减少人工。

附图说明

下面结合附图及实施例对本发明作进一步描述:

图1是本申请提供的一种基于网络服务平台的数据标注系统的结构示意图;

图2是本申请提供的另一种基于网络服务平台的数据标注系统的结构示意图;

图3是本申请提供的一种基于网络服务平台的数据标注方法的流程图;

图4是本申请提供的另一种基于网络服务平台的数据标注方法的流程图。

具体实施方式

实施例:本申请提供了一种基于网络服务平台的数据标注系统,如图1所示,该数据标注系统可以包括:软件客户端和网络服务平台。

软件客户端包括上传下载模块、手动标注模块、自动标注模块。

上传下载模块将任务所需要的标注数据和标注类型下载到软件客户端本地,标注完成后将标注结果上传到网络服务平台。

手动标注模块集成点标注、线标注、二维框标注中的至少一种。

举例说明,点标注可以用在人脸关键点定位、人脸识别上;线标注可以用在车道线检测识别上;二维框可以是车辆行人、交通标志等目标识别,比如标注出矩形框。在实际应用中,还可以包括三维点云标注,用于三维目标的检测。

自动标注模块实现语义分割标注可行驶区域分析,通过人工智能算法辅助标注。比人工标注减少了时间和成本,与传感器数据融合,可以实现更加准确的标注。

网络服务平台可以进行标注任务的派发和接收,功能包括任务发布、任务查询、进度查询、劳务费查询、账目汇总等,将繁琐的人工管理集成在后台服务上,减轻标注管理人员的负担,提高标注效率。其中按角色管理,网络服务平台包括任务发布者模块、任务管理员模块、任务标注者模块,各模块赋予不同权限。

任务发布者模块发布标注任务,可以在网络服务平台发布标注任务,查看任务进度。

任务管理员模块管理标注任务进度。

具体的可以包括对标注任务反馈,劳务费统计以及账目汇总等。

任务标注者模块标注数据并上传标注结果,主要用于管理自身的标注任务。

标注任务发布者发布标注任务,管理标注任务进度,任务管理员对标注任务进行分配,对标注人员进行进度管理,任务标注者标注数据并上传标注结果,最后项目管理者计算价格。

可选的,结合参考图2,软件客户端还包括验收模块、解密模块、价格计算模块、远程更新模块、格式转换模块。

验收模块根据设置的验收模式对标注数据进行验收。

可选的,验收模块提供一键挑图、一键返工、快速入库等功能。

解密模块对标注数据进行高级加密,确保数据安全。

价格计算模块统计已标注数据的标注个数和标注类型,根据标注个数和标注类型计算标注费用。

远程更新模块对软件进行远程更新。

通过远程更新可以及时解决出现的软件bug,并且可以根据用户的反馈增加新的功能。

格式转换模块对标注数据进行格式转换,对需要转换的标注数据进行格式转换。

软件客户端可以分为服务器端和用户端,服务器端实现自动标注功能,用户端进行人工修改和验收等工作,包含二维框、点、线、轮廓、立体框和传感器融合标注功能。

在实际应用中,标注任务发布者可以通过网络服务平台发布标注任务,任务管理员从服务平台查询任务后分配标注者。标注者从服务平台下载标注数据到本地软件客户端进行标注作业,完成标注任务后上传标注数据到网络服务平台,由任务管理员对标注结果进行审核,最后由任务管理员提交最后的标注数据。

可选的,自动标注模块集成基础标注、传感器融合标注、三维点云标注中的至少一种。

基础标注包括点、线、圆、多边形等标注功能,基础标注所要标注的图像内容包括人像、建筑物、植物、道路、交通标志、车辆等,每项内容下面,可以使用不同的标注工具进行标注。

传感器融合标注主要是将图像和激光雷达融合。

三维点云标注通过将图片上的框投影到三维空间中,在对三维空间中的点云修改,最终生成一张合格的三维标注数据。

本申请还提供了一种基于网络服务平台的数据标注方法,应用于如图1或图2所示的基于网络服务平台的数据标注系统中,如图3所示,该方法可以包括:

步骤10,通过任务发布者模块发布标注任务。

任务发布者在网络服务平台创建标注任务,上传数据,上传标注文档,设置截止时间。

步骤20,通过任务管理员模块进行标注任务的分配。

任务管理员配置项目,在网络服务平台指派任务标注人员。

步骤30,通过任务标注者模块接受标注任务。

任务标注者接到标注任务,从网络服务平台下载标注数据和标注规则,开始进行标注作业。

步骤40,通过上传下载模块下载标注数据到软件客户端本地。

步骤50,通过自动标注模块和手动标注模块完成数据标注。

步骤60,通过上传下载模块将标注结果上传至网络服务平台。

标注人员完成标注任务后使用上传下载模块上传到网络服务平台。

步骤70,通过任务管理员模块在线检查标注结果。

任务管理员检查标注质量,将标注不合格的数据挑出,提示任务标注者重新标注。

此外,在实际应用中,如果任务进度延后,可以通过网络服务平台提醒。

步骤80,若检查合格,则任务管理员模块上传最终标注结果。

步骤90,若检查不合格,则将需要重新标注的数据发送到任务标注者模块,继续执行步骤40。

可选的,对于图2中的基于网络服务平台的数据标注系统,在步骤80之后,还可以包括:通过价格计算模块统计已标注数据的标注个数和标注类型,根据标注个数和标注类型计算标注费用;根据计算出的标注费用,通过任务管理员模块支付费用。

网络服务平台可以在任务完成后计算标注个数,计算价格。相应的,标注任务完成后,标注任务发布者在网络服务平台查看标注情况,下载标注结果,支付标注费用。

结合参考图4,其示出了一种基于网络服务平台的数据标注的流程图。

采用深度学习算法自动将图片中的场景进行直接分割出来并自动标注,弥补了人工标注费时费力的问题,通过人工智能算法与标注软件结合,实现大数据的半自动以及自动标注功能,为人工智能算法提供大规模标注数据,对于步骤50,可以包括以下步骤:

第一步,采用深度学习算法对数据进行分析,训练得到分类检测特征。

可选的,可以采用深度学习fast-rcnn对图片进行分析,训练得到图像分类检测特征。

第二步,通过卷积学习网络进行大样本训练,得到分类器。

可选的,可以采用cnn卷积学习网络。

第三步,通过分类器将数据中的目标对象提取出来,对提取到的对象自动打上标注。

通过分类器可以将各种场景或物体从图片中提取出来,将各种分离出来的物体自动打上标注。

第四步,通过人工对自动标注的结果进行检验。

人工复检可以提高标注的准确率。

针对目前标注软件只能标注较少类型的数据以及无法提供大规模标注任务的快速交互,本申请提出通过建立一个网络服务平台来实现对大规模标注任务的有效管理。同时针对日益增长的三维数据标注需求,本申请的标注系统提供3d点云数据的标注支持。利用深度学习算法实现自动标注,大量减少人工,超过人工标注水平,提供更精细的标注服务。

通过网络服务平台集成统计评估功能实现大规模数据标注任务的有效管理,对工作量、标注质量、标注时间等进行统计评估,同时对标注人员管理、标注进度管理、标注质量管理,形成对标注人员的培训建议及对软件的修改建议实现远程更新的信息后台管理系统。

针对目前标注软件标注类型上的不足,增加3d标注功能,对激光雷达采集数据得到的3d点云数据进行标注。

通过深度学习算法实现自动标注,大量减少人工,实现超过人标注水平并提供更精细的标注服务,研发与持续优化物体检测与回归、交互式图像分割、多传感器融合等核心算法,为这类产品的研究提供了一种新的技术方案。

多传感器数据融合标注,将激光雷达和摄像头得到的数据在时间上进行对齐,实现三维激光雷达点云与图像联合标注。

综上所述,本申请提供的基于网络服务平台的数据标注系统及方法,通过将自动标注和手动标注结合,弥补目前标注软件在大规模标注上效率的不足,辅助验收人员对标注人员提交的结果进行统计评估,可对工作量、标注质量、标注时间等进行统计评估,基于网络服务平台集成统计评估管理功能,实现大规模数据标注任务的有效管理,能够同时对人员、标注进度和标注质量进行管理。

另外,增加了验收模块、价格计算模块等,辅助验收人员对提交的标注数据进行评估,同时可以对工作量、标注质量和标注时间等进行统计。

另外,通过集成基础标注、传感器融合标注和三维点云标注等,解决了目前标注系统在管理和标注类型上的不足,增加了3d标注功能,实现三维激光雷达点云和云图像联合标注;通过深度学习算法实现自动标注,大量减少人工。

术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或隐含所指示的技术特征的数量。由此,限定的“第一”、“第二”的特征可以明示或隐含地包括一个或者更多个该特征。在本申请的描述中,除非另有说明,“多个”的含义是两个或者两个以上。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器、磁盘或光盘等。

以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1