数据的识别方法及装置与流程

文档序号:14835886发布日期:2018-06-30 12:23阅读:来源:国知局
数据的识别方法及装置与流程

技术特征:

1.一种数据的识别方法,其特征在于,包括:

获取待识别数据,所述待识别数据中包含有统一资源定位符URL;

将所述待识别数据输入到对应的数据识别模型中,根据模型输出结果得所述统一资源定位符URL中包含的参数信息。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

根据标注信息对用于数据识别模型训练的批量样本数据进行分类,所述训练用样本数据中包含不同类别的标注信息;

对属于同一类别的训练用样本数据进行数据识别模型的训练。

3.根据权利要求2所述的方法,其特征在于,所述标注信息为对统一资源定位符URL中参数信息的标注,对属于同一类别的训练用样本数据进行数据识别模型的训练包括:

根据所述标注信息对所述统一资源定位符URL中参数信息进行训练;所述参数信息包括参数名及参数值;

确定同一类别的训练用样本数据中参数名和/或参数值的特征。

4.根据权利要求3所述的方法,其特征在于,在根据标注信息对用于数据识别模型训练的批量样本数据进行分类之前,所述方法还包括:

对所述训练用样本数据的统一资源定位符URL中的参数名和/或参数值进行标注。

5.根据权利要求4所述的方法,其特征在于,将所述待识别数据输入到对应的数据识别模型中,根据模型输出结果得所述统一资源定位符URL中包含的参数信息包括:

在所述数据识别模型中,解析得到所述待识别数据中统一资源定位符URL中的参数名及对应的参数值;

若能够通过所述参数名识别出所述统一资源定位符URL中包含的参数信息,则将所述参数信息输出;

若不能通过所述参数名识别出所述统一资源定位符URL中包含的参数信息,则对所述参数值进行识别,识别成功后将所述参数信息输出。

6.根据权利要求1-5中任一项所述的方法,其特征在于,所述方法还包括:

将识别后的所述待识别数据存储于训练用数据样本库中;

使用所述训练用数据样本库中的样本数据对所述数据识别模型进行更新训练。

7.一种数据的识别装置,其特征在于,包括:

获取单元,用于获取待识别数据,所述待识别数据中包含有统一资源定位符URL;

处理单元,用于将所述获取单元获取的所述待识别数据输入到对应的数据识别模型中,根据模型输出结果得所述统一资源定位符URL中包含的参数信息。

8.根据权利要求7所述的装置,其特征在于,所述装置还包括:

分类单元,用于根据标注信息对用于数据识别模型训练的批量样本数据进行分类,所述训练用样本数据中包含不同类别的标注信息;

训练单元,用于对所述分类单元确定的属于同一类别的训练用样本数据进行数据识别模型的训练。

9.根据权利要求8所述的装置,其特征在于,所述标注信息为对统一资源定位符URL中参数信息的标注,所述训练单元包括:

训练模块,用于根据所述标注信息对所述统一资源定位符URL中参数信息进行训练;所述参数信息包括参数名及参数值;

确定模块,用于确定同一类别的训练用样本数据中参数名和/或参数值的特征。

10.根据权利要求9所述的装置,其特征在于,所述装置还包括:

标注单元,用于在所述分类单元根据标注信息对用于数据识别模型训练的批量样本数据进行分类之前,对所述训练用样本数据的统一资源定位符URL中的参数名和/或参数值进行标注。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1