关键词提取方法、装置及设备与流程

文档序号:35212012发布日期:2023-08-24 13:32阅读:来源:国知局

技术特征:

1.一种关键词提取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述确定所述待处理文本对应的关键词候选集,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述目标评价值,从所述候选词中选取所述候选关键词,得到所述关键词候选集,包括:

4.根据权利要求1所述的方法,其特征在于,所述确定所述候选文本与所述待处理文本的目标相似度,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于目标文本语义模型,确定所述候选文本与所述待处理文本的目标相似度,包括:

6.根据权利要求4或5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,所述目标训练数据为无标签的训练数据。

8.根据权利要求6所述的方法,其特征在于,所述目标训练数据包括正样本数据和负样本数据;所述获取目标训练数据,包括:

9.根据权利要求1所述的方法,其特征在于,所述在所述目标相似度满足预设条件的情况下,将所述目标相似度对应的候选文本所对应的候选关键词确定为目标关键词,包括:

10.一种关键词提取方法,其特征在于,包括:

11.一种关键词提取装置,其特征在于,包括:

12.一种电子设备,其特征在于,包括:存储器和处理器;

13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当所述计算机执行指令被处理器执行时用于实现权利要求1至10任一项所述的关键词提取方法。

14.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1至10任一项所述的关键词提取方法。


技术总结
本申请实施例提供一种关键词提取方法、装置及设备,该方法包括:电子设备获取待处理文本,并确定待处理文本对应的关键词候选集;针对关键词候选集中的每个候选关键词,从待处理文本中删除候选关键词,得到各个候选关键词对应的候选文本;针对每个候选关键词对应的候选文本,确定候选文本与待处理文本的目标相似度;在目标相似度满足预设条件的情况下,将目标相似度对应的候选文本所对应的候选关键词确定为目标关键词。电子设备从待处理文本删除候选关键词得到候选文本,并且基于候选文本与待处理文本的目标相似度来确定目标关键词,能够实现关键词的自动提取,无需用户人工进行提取,提高了关键词的提取效率和准确率,节省了用户的成本。

技术研发人员:朱翔
受保护的技术使用者:阿里巴巴(中国)有限公司
技术研发日:
技术公布日:2024/1/14
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1