一种文本处理方法以及相关设备与流程

文档序号:37099503发布日期:2024-02-22 20:57阅读:19来源:国知局
一种文本处理方法以及相关设备与流程

本技术涉及计算机,具体涉及一种文本处理方法以及相关设备。


背景技术:

1、用户反馈理解是针对用户的反馈信息,如针对用户的评论、弹幕等文本形式的反馈信息进行深入的学习,从而给出更恰当的理解结果,包括但不限于评价关键词、评价的情绪、评价的摘要等等。此前对于用户反馈理解是无法由一个模型或者方法独立完成的,需要针对不同的子任务采用不同的解决办法。但是应用多个子任务模型,会使得开发和维护成本高,更新难度大,人工成本高。


技术实现思路

1、本技术实施例提供一种文本处理方法以及相关设备,相关设备可以包括文本处理装置、电子设备、计算机可读存储介质和计算机程序产品,可以大幅降低用户反馈理解中所需的开发和维护成本。

2、本技术实施例提供一种文本处理方法,包括:

3、收集目标对象对应的用户反馈文本;

4、调用所述目标对象对应的微调后语言模型,从所述用户反馈文本中提取出反馈理解结果,所述反馈理解结果包括目标关键词、以及所述目标关键词与情感分类结果之间的映射关系;

5、调用所述微调后语言模型,将所述反馈理解结果中待聚合目标关键词聚合到历史近义词库中;

6、调用所述微调后语言模型,根据来源于所述历史近义词库的多个目标样本信息、以及来源于摘要模版库中的目标摘要模版,生成所述用户反馈文本对应的摘要结果。

7、相应的,本技术实施例提供一种文本处理装置,包括:

8、收集单元,用于收集目标对象对应的用户反馈文本;

9、第一调用单元,用于调用所述目标对象对应的微调后语言模型,从所述用户反馈文本中提取出反馈理解结果,所述反馈理解结果包括目标关键词、以及所述目标关键词与情感分类结果之间的映射关系;

10、第二调用单元,用于调用所述微调后语言模型,将所述反馈理解结果中待聚合目标关键词聚合到历史近义词库中;

11、第三调用单元,用于调用所述微调后语言模型,根据来源于所述历史近义词库的多个目标样本信息、以及来源于摘要模版库中的目标摘要模版,生成所述用户反馈文本对应的摘要结果。

12、可选的,在本技术的一些实施例中,文本处理装置还包括获取单元、样本收集单元、匹配单元、以及模型微调单元,如下:

13、获取单元,用于获取预先设置的任务指令集,所述任务指令集中包括多个任务对应的任务指令;

14、样本收集单元,用于收集每个所述任务对应的标注样本;

15、匹配单元,用于将同一所述任务对应的所述标注样本与所述任务指令随机进行匹配,以构建微调数据集;

16、模型微调单元,用于基于所述微调数据集对原始语言模型进行模型微调,得到微调后语言模型。

17、可选的,在本技术的一些实施例中,收集单元具体可以用于收集目标对象对应的初始用户反馈文本;从所述初始用户反馈文本中筛选文本内容符合预设文本内容条件的用户反馈文本。

18、可选的,在本技术的一些实施例中,第一调用单元还包括第一调用子单元、第二调用子单元、以及合并子单元,如下:

19、第一调用子单元,用于调用所述微调后语言模型,从所述用户反馈文本中提取目标关键词;

20、第二调用子单元,用于调用所述微调后语言模型,预测每个所述目标关键词对应的情感分类结果;

21、合并子单元,用于合并所述目标关键词、以及所述情感分类结果,得到反馈理解结果。

22、可选的,在本技术的一些实施例中,第一调用子单元具体可以用于构建关键词提取指示;调用所述微调后语言模型,根据所述关键词提取指示从所述用户反馈文本中提取候选关键词;从所述候选关键词中筛选出未在预设知识图谱中展示的目标关键词。

23、可选的,在本技术的一些实施例中,第二调用子单元具体可以用于构建情感分类指示;调用所述微调后语言模型,根据所述情感分类指示预测每个所述目标关键词对应的情感分类结果。

24、可选的,在本技术的一些实施例中,第二调用单元还包括确定子单元、第三调用子单元、以及聚合子单元,如下:

25、确定子单元,用于确定待聚合目标关键词对应的目标情感分类结果、以及历史近义词库中历史关键词对应的历史目标情感分类结果;

26、第三调用子单元,用于调用所述微调后语言模型,计算所述增量反馈结果中的所述目标关键词与所述历史关键词之间的相似程度;

27、聚合子单元,用于基于所述相似程度,将所述待聚合目标关键词聚合至所述历史近义词库中。

28、可选的,在本技术的一些实施例中,确定子单元具体可以用于基于时间顺序,从所述反馈理解结果中确定增量反馈结果,所述增量反馈结果中的目标关键词为所述待聚合目标关键词;根据所述情感分类结果出现的频率,确定所述增量反馈结果中每个所述目标关键词对应的目标情感分类结果;根据所述历史近义词库中历史情感分类结果出现的频率,确定所述历史近义词库中每个历史关键词对应的历史目标情感分类结果。

29、可选的,在本技术的一些实施例中,聚合子单元具体可以用于若所述增量反馈结果中的所述目标关键词与所述历史关键词之间的所述相似程度满足词语相似条件,且所述增量反馈结果中的所述目标关键词对应的目标情感分类结果与所述历史关键词对应的历史目标情感分类结果满足情感分类结果一致条件,将所述目标关键词聚合到所述历史近义词库中。

30、可选的,在本技术的一些实施例中,第三调用单元还包括第四调用子单元、获取子单元、以及补充子单元,如下:

31、第四调用子单元,用于调用所述微调后语言模型,根据多个目标样本信息生成候选摘要结果;

32、获取子单元,用于随机从摘要模版库中获取目标摘要模版;

33、补充子单元,用于将所述候选摘要生成结果补充至所述目标摘要模版中,生成所述用户反馈文本对应的摘要结果。

34、可选的,在本技术的一些实施例中,第四调用子单元具体可以用于根据语义簇中的词语数量,从所述历史近义词库的多个语义簇中获取多个目标样本信息;构建摘要生成指示;调用所述微调后语言模型,基于摘要生成指示,根据多个目标样本信息生成候选摘要生成结果。

35、本技术实施例提供的一种电子设备,包括处理器和存储器,所述存储器存储有多条指令,所述处理器加载所述指令,以执行本技术实施例提供的文本处理方法中的步骤。

36、本技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现本技术实施例提供的文本处理方法中的步骤。

37、此外,本技术实施例还提供一种计算机程序产品,包括计算机程序或指令,该计算机程序或指令被处理器执行时实现本技术实施例提供的文本处理方法中的步骤。

38、本技术实施例提供了一种文本处理方法以及相关设备,可以收集目标对象对应的用户反馈文本;调用目标对象对应的微调后语言模型,从用户反馈文本中提取出反馈理解结果,反馈理解结果包括目标关键词、以及目标关键词与情感分类结果之间的映射关系;调用微调后语言模型,将反馈理解结果中待聚合目标关键词聚合到历史近义词库中;调用微调后语言模型,根据来源于历史近义词库的多个目标样本信息、以及来源于摘要模版库中的目标摘要模版,生成用户反馈文本对应的摘要结果。由于本技术技术方案仅仅使用一种微调后语言模型,就可以实现多种任务要求,因此无需构建多个子任务模型,不但可以大幅降低用户反馈理解中所需的开发和维护成本,还可以大幅降低更新难度、以及人工成本。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1