本说明书涉及人工智能,尤其涉及一种生成对话信息的方法、装置、可读存储介质以及设备。
背景技术:
1、目前,随着人工智能技术的发展和业务融合的需要,人工智能技术被越来越多地使用在人们的生活中。如何基于用户发送的语料,自动向用户回复信息,实现人机对话,已经成为人工智能领域中的一个重要研究方向。
2、现有的生成对话信息的方法中,通常为智能对话系统接收用户发送的语料信息,并基于用户语料信息确定用户意图,再根据用户意图从预先设置的模板中确定该用户意图对应的模板,以基于确定出的模板生成反馈信息,并将反馈信息发送给用户。
3、但是,现有技术确定出的反馈信息可能与用户预期并不相符,或需花费较长时间,与用户交互较多次数才能得到符合用户预期的反馈信息,准确率较低。
技术实现思路
1、本说明书提供一种生成对话信息的方法、装置、可读存储介质以及设备,以部分的解决现有技术存在的上述问题。
2、本说明书采用下述技术方案:
3、本说明书提供一种生成对话信息的方法,包括:
4、获取用户发送的对话数据,以及所述用户的历史业务数据;
5、根据所述历史业务数据,从所述用户执行的历史业务中确定指定业务数据,并确定所述指定业务数据包含的实体词,作为参考词,以及确定所述对话数据中包含的实体词,作为目标词,所述指定业务数据为所述用户执行过指定操作的业务对应的业务数据;
6、根据各目标词和各参考词的匹配结果,对所述对话数据进行调整,得到目标对话特征;
7、根据所述目标对话特征,得到回复语料,并将所述回复语料返回给所述用户。
8、可选的,根据各目标词和各参考词的匹配结果,对所述对话数据进行调整,具体包括:
9、针对每个目标词,将所述目标词与各参考词进行匹配;
10、根据匹配结果,确定与所述目标词匹配的参考词,作为指定词;
11、将所述对话数据中的该目标词替换为所述指定词;
12、将替换后的所述对话数据作为调整后的对话数据。
13、可选的,根据所述目标对话特征,得到回复语料,具体包括:
14、根据所述历史业务数据中的历史评论信息、所述用户和人工客服的历史对话记录、所述用户和智能对话系统的历史对话记录以及历史浏览信息,确定所述用户的投诉特征;
15、根据所述目标对话特征和所述投诉特征,确定回复语料。
16、可选的,所述对话数据为多轮对话数据,所述多轮对话数据中包含当前轮用户发送的信息、当前轮之前各轮对话中所述用户发送的信息和智能对话系统的回复语料;
17、得到目标对话特征,具体包括:
18、根据调整后的对话数据,确定所述对话数据中的各词向量;
19、针对每个词向量,确定该词向量对应的位置向量、该词向量对应的角色向量、以及该词向量对应的轮数向量;
20、根据所述各词向量、所述各词向量分别对应的位置向量、所述各词向量分别对应的角色向量以及所述各词向量分别对应的轮数向量,确定目标对话特征。
21、可选的,根据所述目标对话特征,得到回复语料,具体包括:
22、根据所述历史业务数据,确定所述用户的用户特征,并根据所述用户特征和目标对话特征,确定所述对话数据对应的情感特征,所述情感特征用于表征所述用户发送所述对话数据时的情感;
23、确定所述目标对话特征中,基于调整后的对话数据中的各词向量确定出的初始对话分量;
24、将所述情感特征和所述初始对话分量进行融合,并根据融合后的目标对话特征,得到回复语料。
25、可选的,采用下述方式训练所述对话模型:
26、获取各样本用户的历史业务数据,并根据各历史业务数据,确定所述各样本用户分别对应的各样本对话数据;
27、针对每个样本用户,将该样本用户的历史业务数据与该样本用户对应的所述各样本对话数据分别进行组合,确定该样本用户对应的各训练样本;
28、针对每个训练样本,将该训练样本中样本对话数据对应的回复语料作为该训练样本的第一标注,以及回复语料对应的回复策略作为该训练样本的第二标注;
29、将该训练样本作为输入,输入待训练的对话模型,得到所述对话模型输出的该训练样本的预测回复策略和预测回复语料;
30、根据各训练样本的预测回复语料及其第一标注,确定第一损失,并根据各第二训练样本的预测回复策略及其第二标注,确定第二损失,以所述第一损失和所述第二损失之和最小为目标,调整所述对话模型的模型参数。
31、可选的,所述对话模型为预训练语言模型;
32、将该样本用户的历史业务数据与该样本用户对应的所述各样本对话数据分别进行组合,确定该样本用户对应的各训练样本,具体包括:
33、获取该对话模型对应的模板;
34、针对每个样本对话数据,将该样本对话数据、该样本用户对应的历史业务数据和所述模板进行组合,确定该样本对话数据对应的训练样本。
35、本说明书还提供一种数据处理装置,所述装置包括:
36、获取模块,用于获取用户发送的对话数据,以及所述用户的历史业务数据;
37、特征提取模块,用于根据所述历史业务数据,从所述用户执行的历史业务中确定指定业务数据,并确定所述指定业务数据包含的实体词,作为参考词,以及确定所述对话数据中包含的实体词,作为目标词,所述指定业务数据为所述用户执行过指定操作的业务对应的业务数据;
38、调整模块,用于根据各目标词和各参考词的匹配结果,对所述对话数据进行调整,得到目标对话特征;
39、回复模块,用于根据所述目标对话特征,得到回复语料,并将所述回复语料返回给所述用户。
40、本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述生成对话信息的方法。
41、本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述生成对话信息的方法。
42、本说明书采用的上述至少一个技术方案能够达到以下有益效果:
43、在本说明书提供的生成对话信息的方法中,通过在获取用户的对话数据的同时,获取用户的历史业务数据,并根据历史业务数据,从该用户执行的历史业务中确定指定业务数据,以及将该指定业务数据包含的实体词作为参考词,将对话数据包含的实体词作为目标词,根据各目标词和各参考词的匹配结果,将对话数据进行调整,得到目标对话特征,再根据目标对话特征确定给用户的反馈信息。
44、从上述方法可以看出,本方法通过用户执行过指定操作的业务对应的指定业务数据,将对话数据进行调整,并基于调整后的对话数据来确定返回给用户的回复语料,确定出的回复语料与用户预期更加匹配,准确率更高。
1.一种生成对话信息的方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,根据各目标词和各参考词的匹配结果,对所述对话数据进行调整,具体包括:
3.如权利要求1所述的方法,其特征在于,根据所述目标对话特征,得到回复语料,具体包括:
4.如权利要求1所述的方法,其特征在于,所述对话数据为多轮对话数据,所述多轮对话数据中包含当前轮用户发送的信息、当前轮之前各轮对话中所述用户发送的信息和智能对话系统的回复语料;
5.如权利要求4所述的方法,其特征在于,根据所述目标对话特征,得到回复语料,具体包括:
6.如权利要求1~5任一所述的方法,其特征在于,采用下述方式训练所述对话模型:
7.如权利要求6所述的方法,其特征在于,所述对话模型为预训练语言模型;
8.一种数据处理装置,其特征在于,所述装置包括:
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。