本公开涉及计算机,特别是涉及一种应答优化方法、装置、电子设备及计算机可读存储介质。
背景技术:
1、随着智能问答在各个领域的推广应用,问答式的产品交互方式逐渐普及。
2、为了提高模型效果,开发者需要收集用户对模型回答的反馈,用户的反馈越准确、具体,无疑会对模型的优化和开发者的收集工作带来更大的帮助。
3、因此,如何为用户提供一种更为准确、具体的用户反馈方式,是目前亟待解决的问题。
技术实现思路
1、本公开的目的在于,通过设计一种更为、具体的用户反馈方式,提高模型优化效果。
2、根据本公开的第一个方面,提供了一种应答优化方法,包括:提供针对应答内容的评价服务以及关联问答选择服务,所述应答内容是由生成式模型基于多轮问答过程中的至少一个提问信息生成的;利用所述评价服务获取用户针对所述应答内容反馈的评价信息;利用所述关联问答选择服务获取用户针对所述应答内容选择的关联问答信息;基于所述评价信息和所述关联问答信息,优化所述生成式模型。
3、可选地,提供针对应答内容的评价服务以及关联问答选择服务,包括:在应答界面上展示至少一个操作控件;利用所述评价服务获取用户针对所述应答内容反馈的评价信息,包括:基于用户针对所述操作控件执行的操作,获取用户针对所述应答内容反馈的评价信息。
4、可选地,基于用户针对所述操作控件执行的操作,获取用户针对所述应答内容反馈的评价信息,包括:响应于用户针对所述操作控件执行第一预定操作,输出评价界面,所述评价界面中展示有多个评价等级;响应于用户针对所述多个评价等级执行的选择操作,在所述评价界面中展示与用户选择的评价等级相匹配的第一评价信息;基于用户选择的评价等级以及所述第一评价信息,确定用户反馈的评价信息。
5、可选地,所述第一评价信息包括多个第一评价内容,该方法还包括:响应于用户针对所述多个第一评价内容执行的选择操作,突出展示用户选择的第一评价内容;其中,所述评价信息包括:用户选择的评价等级;以及用户选择的第一评价内容。
6、可选地,该方法还包括:响应于用户针对当前选择的评价等级执行的切换操作,输出与切换后评价等级相匹配的评价信息。
7、可选地,所述至少一个操作控件包括第一操作控件和第二操作控件,基于用户针对所述操作控件执行的操作,获取用户针对所述应答内容反馈的评价信息,包括:响应于用户针对所述第一操作控件执行第二预定操作,输出评价界面,所述评价界面中展示有多个第二评价内容,所述第二评价内容为负面的评价内容;基于用户针对所述多个第二评价内容执行的选择操作,确定用户反馈的评价信息。
8、可选地,所述评价界面中还包括第一关联问答选择控件,利用所述关联问答选择服务获取用户针对所述应答内容选择的关联问答信息,包括:响应于用户针对所述第一关联问答选择控件执行第四预定操作,从所述评价界面切换到所述应答界面,所述应答界面中的提问信息和应答内容处于可供选择状态;基于用户针对所述应答界面中的提问信息和/或应答内容执行的选择操作,获取所述关联问答信息。
9、可选地,所述评价界面中还包括第二关联问答选择控件,利用所述关联问答选择服务获取用户针对所述应答内容选择的关联问答信息,包括:响应于用户针对所述第二关联问答选择控件执行第五预定操作,在所述评价界面中展示提问信息列表,所述提问信息列表包括多轮问答过程中的提问信息和应答内容;基于用户针对所述提问信息列表中的提问信息和/或应答内容执行的选择操作,获取所述关联问答信息。
10、可选地,所述评价界面中还包括输入控件,该方法还包括:获取用户通过所述输入控件输入的反馈信息。
11、可选地,基于所述评价信息和所述关联问答信息,优化所述生成式模型,包括:基于所述评价信息和所述关联问答信息,确定所述应答内容所针对的提问信息的标准应答;基于所述标准应答和所述关联问答信息,微调所述生成式模型。
12、可选地,该方法还包括:输出与所述应答内容对应的来源标识,所述来源标识用于标识至少部分所述应答内容的数据源。
13、可选地,该方法还包括:基于所述提问信息,在目标知识库中进行关联知识检索,得到关联知识,其中,所述关联知识的数据规模小于所述目标知识库的数据规模;将所述提问信息与所述关联知识作为生成式模型的输入,并获取所述生成式模型的输出结果,得到所述应答内容。
14、可选地,生成式模型包括:文本生成模型与多模态插件;其中,所述文本生成模型用于生成应答文本,所述多模态插件用于生成多模态应答内容,所述多模态应答内容包括如下至少一种:矢量图、视频、图像、表格、语音。
15、根据本公开的第二个方面,提供了一种应答优化装置,包括:提供模块,用于提供针对应答内容的评价服务以及关联问答选择服务,所述应答内容是由生成式模型基于多轮问答过程中的至少一个提问信息生成的;第一获取模块,用于利用所述评价服务获取用户针对所述应答内容反馈的评价信息;第二获取模块,用于利用所述关联问答选择服务获取用户针对所述应答内容选择的关联问答信息;优化模块,用于基于所述评价信息和所述关联问答信息,优化所述生成式模型。
16、可选地,所述提供模块在应答界面上展示至少一个操作控件;所述第一获取模块基于用户针对所述操作控件执行的操作,获取用户针对所述应答内容反馈的评价信息。
17、可选地,所述第一获取模块包括:第一输出模块,用于响应于用户针对所述操作控件执行第一预定操作,输出评价界面,所述评价界面中展示有多个评价等级;第一展示模块,用于响应于用户针对所述多个评价等级执行的选择操作,在所述评价界面中展示与用户选择的评价等级相匹配的第一评价信息;第一确定模块,用于基于用户选择的评价等级以及所述第一评价信息,确定用户反馈的评价信息。
18、可选地,所述第一评价信息包括多个第一评价内容,该装置还包括:突出展示模块,用于响应于用户针对所述多个第一评价内容执行的选择操作,突出展示用户选择的第一评价内容;其中,所述评价信息包括:用户选择的评价等级;以及用户选择的第一评价内容。
19、可选地,所述第一展示模块还响应于用户针对当前选择的评价等级执行的切换操作,输出与切换后评价等级相匹配的评价信息。
20、可选地,所述至少一个操作控件包括第一操作控件和第二操作控件,所述第一获取模块包括:第二输出模块,用于响应于用户针对所述第一操作控件执行第二预定操作,输出评价界面,所述评价界面中展示有多个第二评价内容,所述第二评价内容为负面的评价内容;第二确定模块,用于基于用户针对所述多个第二评价内容执行的选择操作,确定用户反馈的评价信息。
21、可选地,所述评价界面中还包括第一关联问答选择控件,所述第二获取模块包括:切换模块,用于响应于用户针对所述第一关联问答选择控件执行第四预定操作,从所述评价界面切换到所述应答界面,所述应答界面中的提问信息和应答内容处于可供选择状态;第一获取子模块,用于基于用户针对所述应答界面中的提问信息和/或应答内容执行的选择操作,获取所述关联问答信息。
22、可选地,所述评价界面中还包括第二关联问答选择控件,所述第二获取模块包括:第二展示模块,用于响应于用户针对所述第二关联问答选择控件执行第五预定操作,在所述评价界面中展示提问信息列表,所述提问信息列表包括多轮问答过程中的提问信息和应答内容;第二获取子模块,用于基于用户针对所述提问信息列表中的提问信息和/或应答内容执行的选择操作,获取所述关联问答信息。
23、可选地,所述评价界面中还包括输入控件,该装置还包括:第三获取模块,用于获取用户通过所述输入控件输入的反馈信息。
24、可选地,所述优化模块包括:第三确定模块,用于基于所述评价信息和所述关联问答信息,确定所述应答内容所针对的提问信息的标准应答;微调模块,用于基于所述标准应答和所述关联问答信息,微调所述生成式模型。
25、可选地,该装置还包括:输出模块,用于输出与所述应答内容对应的来源标识,所述来源标识用于标识至少部分所述应答内容的数据源。
26、可选地,该装置还包括:检索模块,用于基于所述提问信息,在目标知识库中进行关联知识检索,得到关联知识,其中,所述关联知识的数据规模小于所述目标知识库的数据规模;第四获取模块,用于将所述提问信息与所述关联知识作为生成式模型的输入,并获取所述生成式模型的输出结果,得到所述应答内容。
27、可选地,所述生成式模型包括:文本生成模型与多模态插件;其中,所述文本生成模型用于生成应答文本,所述多模态插件用于生成多模态应答内容,所述多模态应答内容包括如下至少一种:矢量图、视频、图像、表格、语音。
28、根据本公开的第三个方面,提供了一种计算设备,包括:处理器;以及存储器,其上存储有可执行代码,当可执行代码被处理器执行时,使处理器执行如上述第一个方面所述的方法。
29、根据本公开的第四个方面,提供了一种计算机程序产品,包括可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上述第一个方面所述的方法。
30、根据本公开的第五个方面,提供了一种非暂时性机器可读存储介质,其上存储有可执行代码,当可执行代码被电子设备的处理器执行时,使处理器执行如上述第一个方面所述的方法。
31、由此,本公开在提供针对应答内容的评价服务的同时还提供关联问答选择服务,使得不仅可以获取用户针对应答内容反馈的评价信息,还可以获取用户针对应答内容选择的关联问答信息。如此,基于本公开可以得到更为具体准确的用户反馈,因而可以更好地用于模型优化。