对话生成方法、模型的训练方法、装置、设备及介质与流程

文档序号:30983173发布日期:2022-08-03 01:02阅读:来源:国知局

技术特征:
1.一种对话生成方法,包括:基于对话信息,生成检索信息;提取所述检索信息中的检索对象;从与所述检索对象相匹配的数据源中,确定与所述检索信息相匹配的知识信息;以及基于所述知识信息,生成与所述对话信息相匹配的知识回复内容。2.根据权利要求1所述的方法,还包括:基于所述对话信息,生成通用回复内容;以及基于所述知识回复内容和所述通用回复内容,确定目标回复内容。3.根据权利要求1或2所述的方法,其中,所述确定与所述检索信息相匹配的知识信息包括:确定与所述检索信息相匹配的多个候选知识信息;以及基于所述多个候选知识信息各自的点击率,从所述多个候选知识信息中确定所述知识信息。4.一种用于对话生成的模型的训练方法,包括:基于训练样本的样本对话信息,生成样本检索信息,其中,所述训练样本还包括与所述样本对话信息相匹配的样本参考回复内容;提取所述样本检索信息中的检索对象;从与所述检索对象相匹配的数据源中,确定与所述样本检索信息相匹配的样本知识信息;基于所述样本知识信息,生成样本知识回复内容;以及利用所述样本知识回复内容和所述样本参考回复内容,训练深度学习模型,得到语言处理模型。5.根据权利要求4所述的方法,其中,所述利用所述样本知识回复内容和所述样本参考回复内容,训练所述深度学习模型,得到语言处理模型包括:确定所述样本知识回复内容和所述样本参考回复内容之间的第一目标匹配度;以及基于所述第一目标匹配度调整所述深度学习模型的参数,得到所述语言处理模型。6.根据权利要求5所述的方法,其中,所述确定所述样本知识回复内容和所述样本参考回复内容之间的第一目标匹配度包括:确定所述样本知识回复内容的内容类型;以及采用与所述内容类型相匹配的相关性确定方式,确定所述样本知识回复内容和所述样本参考回复内容之间的所述第一目标匹配度。7.根据权利要求4至6中任一项所述的方法,还包括:基于所述样本对话信息,得到样本通用回复内容;所述利用所述样本知识回复内容和所述样本参考回复内容,训练所述深度学习模型,得到语言处理模型包括:利用所述样本知识回复内容、所述样本通用回复内容和所述样本参考回复内容,训练所述深度学习模型,得到所述语言处理模型。8.根据权利要求7所述的方法,其中,所述利用所述样本知识回复内容、所述样本通用回复内容和所述样本参考回复内容,训练所述深度学习模型,得到所述语言处理模型包括:
确定所述样本知识回复内容与所述样本参考回复内容之间的第一匹配度;确定所述样本通用回复内容与所述样本参考回复内容之间的第二匹配度;从所述第一匹配度和所述第二匹配度中确定第二目标匹配度;以及基于所述第二目标匹配度调整所述深度学习模型的参数,得到所述语言处理模型。9.根据权利要求6所述的方法,其中,所述第一目标匹配度包括以下至少一项:语义相似度、特征相似度、共现词频率;其中,所述内容类型包括以下至少一项:链接、图像、文本。10.根据权利要求4至9中任一项所述的方法,其中,所述确定与所述样本检索信息相匹配的样本知识信息包括:确定与所述样本检索信息相匹配的多个样本候选知识信息;以及基于所述多个样本候选知识信息各自的点击率,从所述多个样本候选知识信息中确定所述样本知识信息。11.一种对话生成方法,包括:将对话信息输入至语言处理模型中,得到与所述对话信息相匹配的知识回复内容,其中,所述语言处理模型是利用根据权利要求4至10中任一项所述的方法训练的。12.一种对话生成装置,包括:第一生成模块,用于基于对话信息,生成检索信息;提取模块,用于提取所述检索信息中的检索对象;检索模块,用于从与所述检索对象相匹配的数据源中,确定与所述检索信息相匹配的知识信息;以及第二生成模块,用于基于所述知识信息,生成与所述对话信息相匹配的知识回复内容。13.根据权利要求12所述的装置,还包括:第三生成模块,用于基于所述对话信息,生成通用回复内容;以及确定模块,用于基于所述知识回复内容和所述通用回复内容,确定目标回复内容。14.根据权利要求12或13所述的装置,其中,所述检索模块包括:第一确定单元,用于确定与所述检索信息相匹配的多个候选知识信息;以及第二确定单元,用于基于所述多个候选知识信息各自的点击率,从所述多个候选知识信息中确定所述知识信息。15.一种用于对话生成的模型的训练装置,包括:第一样本生成模块,用于基于训练样本的样本对话信息,生成样本检索信息,其中,所述训练样本还包括与所述样本对话信息相匹配的样本参考回复内容;样本提取模块,用于提取所述样本检索信息中的检索对象;样本检索模块,用于从与所述检索对象相匹配的数据源中,确定与所述样本检索信息相匹配的样本知识信息;第二样本生成模块,用于基于所述样本知识信息,生成样本知识回复内容;以及训练模块,用于利用所述样本知识回复内容和所述样本参考回复内容,训练深度学习模型,得到语言处理模型。16.根据权利要求15所述的装置,其中,所述训练模块包括:匹配度确定单元,用于确定所述样本知识回复内容和所述样本参考回复内容之间的第
一目标匹配度;以及调参单元,用于基于所述第一目标匹配度调整所述深度学习模型的参数,得到所述语言处理模型。17.根据权利要求16所述的装置,其中,所述匹配度确定单元包括:类型确定子单元,用于确定所述样本知识回复内容的内容类型;以及相关性确定子单元,用于采用与所述内容类型相匹配的相关性确定方式,确定所述样本知识回复内容和所述样本参考回复内容之间的所述第一目标匹配度。18.根据权利要求15至17中任一项所述的装置,还包括:第三样本生成模块,用于基于所述样本对话信息,得到样本通用回复内容;所述训练模块包括:训练单元,用于利用所述样本知识回复内容、所述样本通用回复内容和所述样本参考回复内容,训练所述深度学习模型,得到所述语言处理模型。19.根据权利要求18所述的装置,其中,所述训练单元包括:第一确定子单元,用于确定所述样本知识回复内容与所述样本参考回复内容之间的第一匹配度;第二确定子单元,用于确定所述样本通用回复内容与所述样本参考回复内容之间的第二匹配度;第三确定子单元,用于从所述第一匹配度和所述第二匹配度中确定第二目标匹配度;以及调参子单元,用于基于所述第二目标匹配度调整所述深度学习模型的参数,得到所述语言处理模型。20.根据权利要求16所述的装置,其中,所述第一目标匹配度包括以下至少一项:语义相似度、特征相似度、共现词频率;其中,所述内容类型包括以下至少一项:链接、图像、文本。21.根据权利要求4至9中任一项所述的装置,其中,所述样本检索模块包括:第一样本确定单元,用于确定与所述样本检索信息相匹配的多个样本候选知识信息;以及第二样本确定单元,用于基于所述多个样本候选知识信息各自的点击率,从所述多个样本候选知识信息中确定所述样本知识信息。22.一种对话生成装置,包括:对话生成模块,用于将对话信息输入至语言处理模型中,得到与所述对话信息相匹配的知识回复内容,其中,所述语言处理模型是利用根据权利要求15至21中任一项所述的装置训练的。23.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至11中任一项所述的方法。24.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于
使所述计算机执行根据权利要求1至11中任一项所述的方法。25.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至11中任一项所述的方法。

技术总结
本公开提供了对话生成方法、用于对话生成的模型的训练方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及深度学习、智能搜索、语音技术等技术领域。具体实现方案为:基于对话信息,生成检索信息;提取检索信息中的检索对象;从与检索对象相匹配的数据源中,确定与检索信息相匹配的知识信息;以及基于知识信息,生成与对话信息相匹配的知识回复内容。识回复内容。识回复内容。


技术研发人员:鲍思琪 黄信娴 何煌 王凡 吴华 黄世维 何径舟
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2022.04.29
技术公布日:2022/8/2
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1