本公开涉及人工智能领域,尤其涉及一种大型语音模型的操作方法、计算设备及存储介质。
背景技术:
1、大型语言模型(large language model,llm)是指那些参数规模庞大的自然语言处理(natural language processing,nlp)模型。
2、llm在nlp任务中取得了显著的进展并广泛应用于各类对话系统。对话系统通常需要执行各种分类任务,但llm的推理结果通常无法符合特定模式,导致无法准确识别对应任务类别,从而降低对话系统的使用体验。
技术实现思路
1、根据本公开的第一方面,提出了一种llm的操作方法,包括:获取所述llm针对第一输入的第一输出,所述第一输入基于第一查询和分类提示语构造;使用所述第一查询和所述第一输出构造第二输入;将所述第二输入作为输入送入分类模型;以及获取所述分类模型针对所述第二输入的分类结果,作为所述llm针对所述第一查询的分类结果。
2、可选地,使用所述第一查询和所述第一输出构造第二输入包括:使用分隔符拼接所述第一查询和所述第一输出;以及使用拼接结果作为所述第二输入。
3、可选地,所述方法还包括在获取所述llm针对第一输入的第一输出之前:获取与所述第一查询属于相同业务领域的第二查询以及所述第二查询的第二标签;基于所述第二查询和所述分类提示语构造第三输入;以及使用所述第三输入以及所述第二标签微调所述llm的参数,其中,所述第二查询和所述第二标签属于llm微调任务数据集。
4、可选地,获取所述llm针对第一输入的第一输出包括:获取经微调的所述llm针对所述第一输入的所述第一输出。
5、可选地,所述分类模型是利用文本进行过预训练的分类模型,并且,所述方法还包括:在获取所述分类模型针对所述第二输入的分类结果之后,基于与所述第一查询对应的第一标签,调整所述分类模型的参数,其中,所述第一查询和所述第一标签属于分类模型调整任务数据集。
6、可选地,使用至少部分相同的数据内容构造所述llm微调任务数据集和所述分类模型调整任务数据集,其中,针对所述至少部分相同的数据内容,所述第一查询和所述第二查询相同并且所述第一标签与所述第二标签相同。
7、根据本公开的第二方面,提出了一种nlp方法,包括:获取文本输入;将所述文本输入作为第一查询执行如第一方面所述的方法以获取所述分类结果;以及基于所述分类结果,执行针对所述文本输入的对应操作。
8、根据本公开的第三方面,提出了一种终端设备,包括:处理器;以及
9、存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行基于如第一方面和/或第二方面所述的方法。
10、根据本公开的第四方面,提出了一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行基于如第一方面和/或第二方面所述的方法。
11、根据本公开的第五方面,提出了一种计算机程序产品,包括计算机程序指令,其特征在于,该计算机程序指令被处理器执行时实现基于如第一方面和/或第二方面所述的方法。
1.一种大型语言模型(llm)的操作方法,包括:
2.根据权利要求1所述的方法,其中,使用所述第一查询和所述第一输出构造第二输入包括:
3.根据权利要求1所述的方法,还包括在获取所述llm针对第一输入的第一输出之前:
4.根据权利要求3所述的方法,其中,获取所述llm针对第一输入的第一输出包括:
5.根据权利要求3所述的方法,其中,所述分类模型是利用文本进行过预训练的分类模型,并且,所述方法还包括:
6.根据权利要求5所述的方法,其中,使用至少部分相同的数据内容构造所述llm微调任务数据集和所述分类模型调整任务数据集,其中,针对所述至少部分相同的数据内容,所述第一查询和所述第二查询相同并且所述第一标签与所述第二标签相同。
7.一种自然语言处理方法,包括:
8.一种计算设备,包括:
9.一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行基于如权利要求1至7中任一项所述的方法。
10.一种计算机程序产品,包括计算机程序指令,其特征在于,该计算机程序指令被处理器执行时实现基于如权利要求1至7中任一项所述的方法。