一种标注数据的处理方法、装置和介质与流程

文档序号:24931660发布日期:2021-05-04 11:21阅读:来源:国知局

技术特征:

1.一种标注数据的处理方法,其特征在于,包括:

获取经标注人员标注的标注数据;

根据所述标注数据利用预先构建的标注数据审核模型,确定所述标注数据中的错误标注数据,其中所述标注数据审核模型是利用经过审核的标注数据训练的;将所述错误标注数据发送至所述标注人员。

2.根据权利要求1所述的方法,其特征在于,根据所述标注数据利用预先构建的标注数据审核模型,确定所述标注数据中的错误标注数据,包括:

将所述标注数据代入预先构建的标注数据审核模型中,得到所述标注数据的错误概率;

根据所述标注数据的错误概率和预设判断条件,确定所述标注数据中的错误标注数据。

3.根据权利要求2所述的方法,其特征在于,根据所述标注数据的错误概率和预设判断条件,确定所述标注数据中的错误标注数据,包括:

将所述标注数据按照所述错误概率从大到小的顺序排列;

根据预设比例计算所述标注数据中的所述错误标注数据的预设数量;

将排列后的所述标注数据中的前所述预设数量的所述标注数据确定为所述错误标注数据。

4.根据权利要求2所述的方法,其特征在于,根据所述标注数据的错误概率和预设判断条件,确定所述标注数据中的错误标注数据,包括:

从所述标注数据中筛选预定数量的所述标注数据进行审核,得到所述标注数据的错误率;

根据所述标注数据的错误率和所述标注数据的预设正确率,确定所述标注数据达到所述预设正确率需要审核标注的错误标注数据的数量;

将所述标注数据按照所述错误概率从大到小的顺序排列;

对排列后的所述标注数据依次进行审核标注,直到确定所述错误标注数据的数量达到所述需要审核标注的错误标注数据的数量。

5.根据权利要求1所述的方法,其特征在于,在获取经标注人员标注的标注数据之前,包括:

获取已审核标注数据,所述已审核标注数据包含标注信息和审核信息;

根据所述标注信息和所述审核信息,通过监督机器学习模块得到标注数据审核模型。

6.根据权利要求5所述的方法,其特征在于,根据所述标注信息和所述审核信息,通过监督机器学习模块得到标注数据审核模型,包括:

通过所述已审核标注数据中的标注信息和所述审核信息,确定所述已审核标注数据的审核结果;

将所述标注信息、所述审核信息以及所述审核结果代入监督机器学习模块中进行训练,得到标注数据审核模型。

7.根据权利要求5和6任意一项所述的方法,其特征在于,所述监督机器学习模块为卷积神经网络、二分类向量算法、深度神经网络、逻辑回归算法其中的一种或者多种。

8.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求1至7中任意一项所述的标注数据的处理方法。

9.一种标注数据的处理装置,其特征在于,包括:

标注数据获取模块,用于获取经标注人员标注的标注数据;

错误数据确定模块,用于根据所述标注数据利用预先构建的标注数据审核模型,确定所述标注数据中的错误标注数据,其中所述标注数据审核模型是利用经过审核的标注数据训练的;

标注数据发送模块,用于将所述错误标注数据发送至所述标注人员。

10.一种标注数据的处理装置,其特征在于,包括:

处理器;

存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:

获取经标注人员标注的标注数据;

根据所述标注数据利用预先构建的标注数据审核模型,确定所述标注数据中的错误标注数据,其中所述标注数据审核模型是利用经过审核的标注数据训练的;

将所述错误标注数据发送至所述标注人员。


技术总结
本申请公开了一种标注数据的处理方法、装置和存储介质,其中方法包括:获取经标注人员标注的标注数据;根据所述标注数据利用预先构建的标注数据审核模型,确定所述标注数据中的错误标注数据,其中所述标注数据审核模型是利用经过审核的标注数据训练的;以及将所述错误标注数据发送至所述标注人员。通过本实施例,可以提高审核后的标注数据的利用率以及对标注数据进行重标注的标注效率。

技术研发人员:刘睿;靳丁南;罗欢;权圣
受保护的技术使用者:北京中关村科金技术有限公司
技术研发日:2019.10.31
技术公布日:2021.05.04
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1