本公开涉及信息处理,尤其是涉及一种广义意图识别方法、装置以及电子设备。
背景技术:
1、在常见的对话系统中,一般都需要对话agent完成一些特定的功能。其中,agent指能自主活动的软件或者硬件实体;在人工智能领域,可以译为“智能体”。而这些特定功能的实现,常常需要基于业务需求构造对应的意图识别模型,在识别到对应的意图后转到对应的功能上。例如,在agent与人的对话过程中,可能会存在如下几种意图识别模型,比如,agent与用户的好感度变化意图(意图识别空间为:好感度上升,好感度不变,好感度下降),agent是否应该切换话题意图(意图识别空间为:agent应该切换话题,agent不应该切换话题),用户当前输入的情感变化意图(意图识别空间为:用户情感积极,用户情感中性,用户情感下降)。
2、在每次构造新的意图识别模型的过程中,通常都需要相应的运营人员去精心构造对应意图的语料,以实现在业务场景下准确率较高的意图识别模型。因此,准确率较高的意图识别模型通常需要较大的人工参与的成分。而相应意图识别模型在没有人工构造的语料和训练的基础下,就无法进行特定的意图识别,会造成整体对话系统冷启动困难,也会在一定程度上阻塞整个对话系统的开发,即在整个对话系统没有初期对话语料和意图语料积累的情况下,会造成意图识别不准,从而导致下游对话效果差的问题。其中,冷启动指在未积累对应业务数据的情况下运作对话系统。
3、此外,chatgpt是人工智能技术驱动的自然语言处理工具,它能够基于在预训练阶段所见的模式和统计规律,来生成回答,还能根据聊天的上下文进行互动,像人类一样来聊天交流等。虽然chatgpt类的llm(large language model,大语言模型,是一种利用机器学习技术来理解和生成人类语言的人工智能模型),可以在一定程度上缓解通用语义上的广义意图识别冷启动困难的问题,但是这类llm通常也会伴随着训练困难,无法灵活适配适应业务需求,推理性能耗费巨大等问题。
技术实现思路
1、本公开的目的在于提供一种广义意图识别方法、装置以及电子设备,以至少缓解上述问题之一。
2、第一方面,本公开实施例提供了一种广义意图识别方法,包括:
3、获取待识别文本和任务类型数据,所述任务类型数据中的任务类型用于表征待识别的意图;
4、根据所述待识别文本和所述任务类型数据,生成预设数据格式的目标输入数据;其中,所述预设数据格式包括意图类别部分、问题部分和文本部分,所述意图类别部分包括相应任务类型下的各个意图类别,所述问题部分包括相应任务类型在相应文本下被问的问题;
5、根据所述目标输入数据和训练后的意图语义理解模型,确定初始意图识别结果;其中,所述意图语义理解模型中的预训练神经网络模型是基于预训练数据进行预训练得到的,所述预训练数据是对原始意图识别类数据进行所述预设数据格式的转换得到的;
6、根据所述初始意图识别结果和预先构建的向量检索库,确定目标意图识别结果;其中,所述向量检索库是基于业务方预设的意图语料数据构建的。
7、第二方面,本公开实施例还提供了一种广义意图识别装置,包括:
8、数据获取模块,用于获取待识别文本和任务类型数据,所述任务类型数据中的任务类型用于表征待识别的意图;
9、输入生成模块,用于根据所述待识别文本和所述任务类型数据,生成预设数据格式的目标输入数据;其中,所述预设数据格式包括意图类别部分、问题部分和文本部分,所述意图类别部分包括相应任务类型下的各个意图类别,所述问题部分包括相应任务类型在相应文本下被问的问题;
10、第一确定模块,用于根据所述目标输入数据和训练后的意图语义理解模型,确定初始意图识别结果;其中,所述意图语义理解模型中的预训练神经网络模型是基于预训练数据进行预训练得到的,所述预训练数据是对原始意图识别类数据进行所述预设数据格式的转换得到的;
11、第二确定模块,用于根据所述初始意图识别结果和预先构建的向量检索库,确定目标意图识别结果;其中,所述向量检索库是基于业务方预设的意图语料数据构建的。
12、第三方面,本公开实施例又提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的第一方面所述广义意图识别方法。
13、第四方面,本公开实施例又提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述的第一方面所述广义意图识别方法。
14、本公开实施例带来了以下有益效果:
15、本公开实施例提供的一种广义意图识别方法、装置以及电子设备,能够获取待识别文本和任务类型数据,任务类型数据中的任务类型用于表征待识别的意图;根据待识别文本和任务类型数据,生成预设数据格式的目标输入数据;其中,预设数据格式包括意图类别部分、问题部分和文本部分,意图类别部分包括相应任务类型下的各个意图类别,问题部分包括相应任务类型在相应文本下被问的问题;根据目标输入数据和训练后的意图语义理解模型,确定初始意图识别结果;其中,意图语义理解模型中的预训练神经网络模型是基于预训练数据进行预训练得到的,预训练数据是对原始意图识别类数据进行预设数据格式的转换得到的;根据初始意图识别结果和预先构建的向量检索库,确定目标意图识别结果;其中,向量检索库是基于业务方预设的意图语料数据构建的。由于意图语义理解模型中的预训练神经网络模型是基于预设数据格式下的预训练数据进行预训练得到的,预设数据格式包括意图类别部分、问题部分和文本部分,因此预训练神经网络模型可以充分捕捉文本与问题、意图类别之间的语义关联,从而可以适配多种多样的意图识别形式,使得该意图语义理解模型具备通用意图语义理解能力,可以对待识别文本进行多个任务类型下的意图识别;并且只需要对已有的原始意图识别类数据进行预设数据格式的转换,即可得到预训练数据,不需要人工构造语料,减少了人工参与的成分,推理成本较低;另外,结合基于业务方预设的意图语料数据构建的向量检索库,可以支持广义意图的冷启动。
16、为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
1.一种广义意图识别方法,其特征在于,包括:
2.根据权利要求1所述的广义意图识别方法,其特征在于,所述根据所述待识别文本和所述任务类型数据,生成预设数据格式的目标输入数据,包括:
3.根据权利要求1所述的广义意图识别方法,其特征在于,所述根据所述目标输入数据和训练后的意图语义理解模型,确定初始意图识别结果,包括:
4.根据权利要求1所述的广义意图识别方法,其特征在于,所述根据所述初始意图识别结果和预先构建的向量检索库,确定目标意图识别结果,包括:
5.根据权利要求4所述的广义意图识别方法,其特征在于,所述基于所述向量检索库对所述待识别文本进行所述未成功识别的任务类型下的意图类别匹配,得到二次意图识别结果,包括:
6.根据权利要求5所述的广义意图识别方法,其特征在于,所述基于所述目标向量与各个所述候选向量的相似度,确定所述二次意图识别结果,包括:
7.根据权利要求4所述的广义意图识别方法,其特征在于,所述广义意图识别方法还包括:
8.根据权利要求1-7中任一项所述的广义意图识别方法,其特征在于,所述广义意图识别方法还包括:
9.根据权利要求8所述的广义意图识别方法,其特征在于,所述获取所述预设数据格式下带有标签的预训练数据,包括:
10.根据权利要求8所述的广义意图识别方法,其特征在于,所述基于所述预训练数据对所述初始神经网络模型进行预训练,得到所述预训练神经网络模型之后,所述广义意图识别方法还包括:
11.根据权利要求8所述的广义意图识别方法,其特征在于,所述预训练神经网络模型包括transformer模型;所述transformer模型的encoder部分的网络架构为:位置信息表示中数据补齐部分对应的位置信息用0表示,segment信息中除意图类别部分之外的部分均为0,attention中除意图类别部分之外的部分均为0。
12.根据权利要求1-7任一项所述的广义意图识别方法,其特征在于,所述广义意图识别方法还包括:
13.一种广义意图识别装置,其特征在于,包括:
14.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至12任一项所述的广义意图识别方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行所述权利要求1至12任一项所述的广义意图识别方法。