标签集合的生成方法、装置及电子设备与流程

文档序号:37281296发布日期:2024-03-12 21:20阅读:13来源:国知局
标签集合的生成方法、装置及电子设备与流程

本申请涉及计算机,尤其涉及一种标签集合的生成方法、装置及电子设备。


背景技术:

1、在很多业务领域中,需要通过标签对产品、用户、文本等对象进行说明或者分类。比如在手机品类领域中,通常通过“分辨率好”、“像素高”、“内存大”等标签对手机进行说明或者分类;在医药领域中,通常通过“疗效好”、“疗效差”、“价钱高”、“依赖性强”等标签对药品进行说明或者分类等。

2、而在不同的业务领域中,首先需要知晓具有哪些标签,才能从这些标签中确定对象所对应的标签,从而实现对对象的准确说明或者分类。要知晓某个业务领域内具有哪些标签,这就需要挖掘该业务领域内的标签集合。标签集合的质量,极大的影响了对对象进行说明或者分类的准确性。

3、相关技术,通常依靠业务专家对特定领域内的大量业务数据进行总结分析,来挖掘该领域内的标签集合,这种方式受业务专家的经验、人力等的限制,会导致挖掘得到的标签集合中可能存在某些低质量标签,挖掘得到的标签集合的质量较低。


技术实现思路

1、本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

2、本申请实施例提出一种标签集合的生成方法、装置及电子设备,以解决相关技术中标签挖掘得到的标签集合的质量较低的技术问题。

3、本申请第一方面实施例提出了一种标签集合的生成方法,包括:获取特定领域内的多个第一业务数据,以及预设标签集合中各标签对应的标签定义语句,所述标签定义语句用于表示对应标签的定义;对于每个所述第一业务数据,基于所述预设标签集合中各标签对应的标签定义语句,对所述第一业务数据进行标注,以得到所述第一业务数据的标注结果;根据多个所述第一业务数据的标注结果,确定所述预设标签集合中各所述标签的质量,并根据所述预设标签集合中各所述标签的质量,对所述预设标签集合进行更新,以得到所述特定领域内的第一目标标签集合。

4、本申请第二方面实施例提出了一种标签集合的生成装置,包括:第一获取模块,用于获取特定领域内的多个第一业务数据,以及预设标签集合中各标签对应的标签定义语句,所述标签定义语句用于表示对应标签的定义;第一标注模块,用于对于每个所述第一业务数据,基于所述预设标签集合中各标签对应的标签定义语句,对所述第一业务数据进行标注,以得到所述第一业务数据的标注结果;第一更新模块,用于根据多个所述第一业务数据的标注结果,确定所述预设标签集合中各所述标签的质量,并根据所述预设标签集合中各所述标签的质量,对所述预设标签集合进行更新,以得到所述特定领域内的第一目标标签集合。

5、本申请第三方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本申请第一方面实施例提出的标签集合的生成方法。

6、本申请第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如本申请第一方面实施例提出的标签集合的生成方法。

7、本申请第五方面实施例提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本申请第一方面实施例提出的标签集合的生成方法。

8、上述发明中的一个实施例具有如下优点或有益效果:

9、通过获取特定领域内的多个第一业务数据,基于预设标签集合中各标签对应的标签定义语句,对各第一业务数据进行标注,根据多个第一要务数据的标注结果,确定预设标签集合中各标签的质量,进而根据各标签的质量对预设标签集合进行更新,以得到特定领域内的第一目标标签集合,可以生成特定领域内的高质量的标签集合,为准确对对象进行说明或分类奠定基础。

10、本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。



技术特征:

1.一种标签集合的生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述预设标签集合中各标签对应的标签定义语句,对所述第一业务数据进行标注,以得到所述第一业务数据的标注结果,包括:

3.根据权利要求2所述的方法,其特征在于,所述执行所述预设标签集合中所述标签对应的标签定义语句,以判断所述第一业务数据是否满足所述标签的定义,包括:

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求3或4所述的方法,其特征在于,所述正则表达式中包括多个关键词,各所述关键词通过预设分隔符进行分隔;所述方法还包括:

6.根据权利要求3或4所述的方法,其特征在于,所述子句中还包括预设标签的第一宏定义和/或预设字符串的第二宏定义;

7.根据权利要求2所述的方法,其特征在于,所述执行所述预设标签集合中所述标签对应的标签定义语句,以判断所述第一业务数据是否满足所述标签的定义,包括:

8.根据权利要求1-4任一项所述的方法,其特征在于,所述根据多个所述第一业务数据的标注结果,确定所述预设标签集合中各所述标签的质量,并根据所述预设标签集合中各所述标签的质量,对所述预设标签集合进行更新,以得到所述特定领域内的第一目标标签集合,包括:

9.根据权利要求1-4任一项所述的方法,其特征在于,在所述对于每个所述第一业务数据,基于所述预设标签集合中各标签对应的标签定义语句,对所述第一业务数据进行标注,以得到所述第一业务数据的标注结果之前,所述方法还包括:

10.根据权利要求1-4任一项所述的方法,其特征在于,在所述根据所述预设标签集合中各所述标签的质量,对所述预设标签集合进行更新,以得到所述特定领域内的第一目标标签集合之后,还包括:

11.根据权利要求1-4任一项所述的方法,其特征在于,在所述根据所述预设标签集合中各所述标签的质量,对所述预设标签集合进行更新,以得到所述特定领域内的第一目标标签集合之后,还包括:

12.一种标签集合的生成装置,其特征在于,包括:

13.根据权利要求12所述的装置,其特征在于,所述第一标注模块,包括:

14.根据权利要求13所述的装置,其特征在于,所述处理单元,包括:

15.根据权利要求14所述的装置,其特征在于,所述处理单元,还包括:

16.根据权利要求14或15所述的装置,其特征在于,所述正则表达式中包括多个关键词,各所述关键词通过预设分隔符进行分隔;所述处理单元,还包括:

17.根据权利要求14或15所述的装置,其特征在于,所述子句中还包括预设标签的第一宏定义和/或预设字符串的第二宏定义;

18.根据权利要求13所述的装置,其特征在于,所述处理单元,包括:

19.根据权利要求12-15任一项所述的装置,其特征在于,所述第一更新模块,包括:

20.根据权利要求12-15任一项所述的装置,其特征在于,所述装置还包括:

21.根据权利要求12-15任一项所述的装置,其特征在于,所述装置还包括:

22.根据权利要求12-15任一项所述的装置,其特征在于,还包括:

23.一种电子设备,其特征在于,包括:

24.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-11中任一项所述的方法。


技术总结
本申请提出一种标签集合的生成方法、装置及电子设备,涉及计算机技术领域,方法包括:获取特定领域内的多个第一业务数据,以及预设标签集合中各标签对应的标签定义语句,标签定义语句用于表示对应标签的定义;对于每个第一业务数据,基于预设标签集合中各标签对应的标签定义语句,对第一业务数据进行标注,以得到第一业务数据的标注结果;根据多个第一业务数据的标注结果,确定预设标签集合中各标签的质量,并根据预设标签集合中各标签的质量,对预设标签集合进行更新,以得到特定领域内的第一目标标签集合。由此,可以生成特定领域内的高质量的标签集合,为准确对对象进行说明或分类奠定基础。

技术研发人员:吕望,范聪
受保护的技术使用者:北京沃东天骏信息技术有限公司
技术研发日:
技术公布日:2024/3/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1